最新新闻

AI新闻资讯
AI 每日资讯汇集了国内外关于人工智能、大语言模型、多模态模型、机器学习、深度学习、计算机视觉、自然语言处理、数据科学和大数据的所有顶级新闻、视频等内容,一站式获取最新AI资讯。
-
近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。
-
随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。论文中,研究者们特别提到,尽管这些 AI 模型在给出答案之前,往往会生成一系列看似合理…
-
5月,夸克正式上线全新“深度研究”功能,并面向用户限量邀请体验。该功能依托通义千问大模型,支持围绕学术课题、行业分析等复杂议题,完成从资料搜集、数据分析、观点提炼到报告生成的全流程研究,实现“输入主题,输出成品”。
-
字节跳动近日正式发布其最新开源多模态基础模型——BAGEL(Big Advanced Generalized Embodied Learner),以70亿个有效参数的规模,开启多模态AI模型的新阶段。BAGEL在图像理解、生成和编辑等关键任务中表现卓越,已在多个标准评测中超越当前主流开源视觉语言模型(VLM),如Qwen2.5-VL和InternVL-2.5。BAGEL模型基于大规模交错多模态数据…
-
卡内基梅隆大学研究团队发布一项创新性人工智能项目——LegoGPT,该模型可根据自然语言文本自动生成可拼搭的乐高积木设计。项目已在 GitHub 开源,用户可自由下载模型与数据集进行尝试和拓展。LegoGPT 由自回归大型语言模型驱动,训练数据包括超过47,000块乐高积木组成的28,000多个独特3D 对象。用户只需输入如“一个吉他造型”这样的文本提示,模型便能生成结构合理、可稳定搭建的乐高拼搭…
-
一款名为SurfSense的开源AI研究助手横空出世,以其独特的个人知识库整合功能和强大的研究能力,迅速成为NotebookLM和Perplexity的有力竞争者。SurfSense不仅继承了AI驱动的智能搜索与交互特性,还通过打通个人知识库,为用户提供了一个前所未有的信息管理与研究平台。本文基于近期网络信息,深入探讨SurfSense的核心功能、优势以及其对研究领域的潜在影响。突破传统:个人知识…