新闻动态

北京人工智能数据运营平台发布,并开源超大规模高质量数据集
6月14日,AI行业顶级盛会2024北京智源大会正式拉开帷幕。作为大会的重要组成部分,智源大会“人工智能+数据新基建”论坛同步召开。
06.15.2024
查看详情
AI安全水深流急,黄铁军首谈AGI能力与风险分级,2024智源大会圆满落幕
2024年6月15日,为期 2 天的北京智源大会圆满落下帷幕。本次大会围绕大语言模型、多模态模型、Agent、具身智能、数据新基建、AI系统、AI开源、AI for Science、AI安全等人工智能热门技术方向和焦点议题,召开了20+平行论坛,共计百场报告。
06.15.2024
查看详情
2024北京智源大会开幕,智源推出大模型全家桶及全栈开源技术基座新版图,大模型先锋集结共探AGI之路
北京智源大会是智源研究院主办的“AI内行顶级盛会”,以“全球视野、思想碰撞、前沿引领”为特色,汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。
06.14.2024
查看详情
智源联合多所高校推出首个多任务长视频评测基准MLVU
当前,研究社区亟需全面可靠的长视频理解评估基准,以解决现有视频理解评测基准在视频长度不足、类型和任务单一等方面的局限性。
06.13.2024
查看详情
北京大学第一医院与智源研究院共同发布基于可信执行环境的AI医学影像挑战赛
肾动脉狭窄是导致继发性高血压及肾功能不全的常见原因,而目前针对肾动脉狭窄功能学的评估尚处于探索阶段。
05.27.2024
查看详情
2024中关村论坛年会发布七大数据治理成果
人民网北京4月26日电 (记者李博)4月26日,在2024中关村论坛——数据安全治理与发展论坛上,北京市网信办、中国网络安全审查认证和市场监管大数据中心、北京智源人工智能研究院、北京市经信局等单位发布了7项重要实践成果,为数字经济背景下的数据治理提供有益借鉴。
04.26.2024
查看详情
向数字世界AGI迈进,智源提出「通用计算机控制智能体框架Cradle」
信息革命产生了数字世界,数字世界为大模型的诞生提供了数据,也最容易实现通用人工智能(AGI)。
03.07.2024
查看详情
张宏江:大模型技术发展的八点观察
继ChatGPT之后,Sora模型的出现再次激发了各行各业对AI的热情。面对术语的日新月异,个人和企业应用的纷繁涌现,以及商业模式的持续重构,大模型能够展现出惊人的能力并迅速影响社会,这背后有着更深刻的原因。在近日举办的“亚布力中国企业家论坛年会”上,智源研究院学术顾问委员会主任张宏江发表了闭幕式演讲,分享了他对大模型技术发展的八点观察。
03.06.2024
查看详情
Bunny-3B: 数据浓缩技术让3B多模态小模型媲美13B大模型
近期,Microsoft、Google、StabilityAI 等机构发布了多款小语言模型,并由此衍生出了一系列多模态小模型。多模态小模型因为训练和部署成本低,吸引了更多技术人员参与其中,这一趋势将促进大模型技术快速发展和普及。
02.22.2024
查看详情
EVA-CLIP-18B:性能最强的开源CLIP视觉大模型
随着大规模多模态模型在自然语言处理、计算机视觉等领域的发展,对比式语言-图像预训练(CLIP模型)的重要性日益凸显。EVA-CLIP 模型是一种视觉基础模型,能够从视觉信号中提取通用的、含有高层语义信息的视觉表征,为广泛的视觉理解和视觉-语言多模态任务提供感知基础。
02.07.2024
查看详情
年度总结|FlagOpen大模型开源技术体系
2023年3月智源研究院牵头联合多家高校和企业团队,发布了FlagOpen(飞智)大模型技术开源体系,旨在打造全面支撑大模型技术发展的一站式开源项目技术体系,共建共享大模型时代的“新Linux”。
02.06.2024
查看详情
FlagEval 2月榜|新增多个MoE模型及InternLM2系列模型评测结果
为了构建更强大的语言模型,模型的参数规模和复杂度不断增加,导致计算成本持续攀升,对大模型的应用落地造成了阻碍。为了解决这一问题,Mixture-of-Experts(MoE)架构被应用到大语言模型上。简言之,MoE架构是将多个模型(称为“专家 / Experts”)通过“门控网络”结合在一起,选择最合适的“专家”来处理输入,从而减少计算量,有效地提高大模型的推理效率,同时保证较好的性能。
02.05.2024
查看详情
王仲远博士加入智源研究院,接任院长一职
2024年2月1日,中国北京,北京智源人工智能研究院(以下简称“智源研究院”)今日宣布,智源研究院理事会任命王仲远博士接任智源研究院院长,全面负责研究院各项工作。
02.01.2024
查看详情
新一代通用向量模型BGE-M3:一站式支持多语言、长文本和多种检索方式
语义向量模型(Embedding Model)是语言模型生态体系中的重要组成部分,这一技术被广泛应用于搜索(Search)、问答(QA)、大语言模型检索增强(RAG)等应用场景之中。智源 BGE(BAAI General Embedding)模型自去年8月发布后广受好评,被开源爱好者集成至 LangChain、Llama_index 等项目,全球下载量已达713万次。
01.30.2024
查看详情
智源发布多模态模型中文评测基准CMMU,GPT-4V答题准确率约30%
多模态模型(Large Multimodal Model,简称LMM)近期被认为是大模型研究和发展的一个关键领域。与早期只能处理单一数据类型(如文本、图像或音频)的机器学习模型不同,LMM 能同时处理和理解多种数据类型,更接近于人类大脑的工作方式,让人机交互变得更为灵活和多样化,提升模型的综合性能和理解深度。
01.26.2024
查看详情
中国互联网协会人工智能工作委员会2024年度全体会议暨第四期AI智荟沙龙——“大模型的发展态势与评估体系”研讨会在京召开
岁月更替,华章再起。中国互联网协会人工智能工作委员会2024年度全体会议暨第四期AI智荟沙龙—“大模型的发展态势与评估体系”研讨会,1月18日下午在北京智源大厦召开。
01.22.2024
查看详情
2024年中国互联网协会AI工作委员会全体会议暨AI智荟沙龙:大模型的发展态势与评估体系
2024年中国互联网协会AI工作委员会全体会议暨AI智荟沙龙:大模型的发展态势与评估体系
01.17.2024
查看详情
FlagEval 2024年1月榜|平行测验增强主观评测可靠性,新增Mixtral、DeepSeek、MindSource等结果
FlagEval 评测体系致力于对大模型进行科学、可靠、全面的评测,主观评测可以帮助量化大模型输出内容的多样性和新颖性,成为 FlagEval 验证大语言模型能力的主要方法之一。为了保证时效性、防止评测数据泄露,主观评测集需要持续更新和迭代。如何保证迭代过程中评测结果的一致性和可靠性,就成为了我们亟需解决的问题。
01.17.2024
查看详情
GeoDream:将2D和3D先验解耦,生成高质量和多视角一致性的3D资产
3D建模是游戏、影视和AR/VR等多个行业的基础。然而目前模型生产普遍依赖专业3D从业者的手工建模,生产周期和成本一直居高不下。目前生成式AI技术貌似让3D建模这个产业发生变革,一个拥有丰富想象力的赛道正在开启。
01.15.2024
查看详情
量化新范式:智源提出首个1bit自然语言理解预训练模型BiPFT
预训练模型近年来成为了实现通用人工智能最有潜力的技术之一。然而,为了最大限度地提高基座模型的知识存储,增大模型规模也给推理带来了挑战,尤其是在计算资源有限的设备上,例如移动设备。
01.10.2024
查看详情
FlagData 2.0:全面、高效的大模型训练数据治理工具集
数据是大模型训练至关重要的一环。数据规模、质量、配比,很大程度上决定了最后大模型的性能表现。无论是大规模的预训练数据、精益求精的SFT数据都依托于一个完整的“获取-准备-处理-分析”数据流程。然而,当前的开源工具通常只专注于流程中的某一环节,很少有能够覆盖整个流程的项目。此外,这些工具处理的数据质量参差不齐,很难“干净地”从不同原始数据中提取表格、图片等结构化信息,这给构建大模型的训练数据集带来了极大的挑战。
12.31.2023
查看详情