大模型

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架

编辑 | ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choice questions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答(openQA

2024小米科技春晚,MIX Fold4、MIX Flip、SU7 Ultra Prototype等重磅亮相

SU7 开卖后雷军的第一场年度演讲,意义非凡。

对话南洋理工大学安波教授:如何让大语言模型适应动态环境?丨IJAIRR

对人类越是简单的问题,大语言模型反而越难以做好? 尽管现在的大模型已经有能力冲击数学竞赛级别的题目,但在像“9.11和9.9谁大”这样的简单问题上仍然会翻船。 而从推特上网友对问题的讨论中猜测,出现这种错误的原因可能是由于大模型以token的方式来理解文字,当9.11被拆成“9”、“.”和“11”三部分时,11确实比9大。

机器人大模型新公司!数据规模比同行大1000倍!贝索斯、孙正义等押注

机器之能报道编辑:Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近,Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人,还是四足机器狗,都要有脑子。过去,脑子要定制,「专款专用」,现在,不必了。最近,位于匹兹堡的机器人初创 Skild AI  声称,已经开发出一种通用的智能系统。它就像一个通用的智能模块,可以接入不同机器人,让他们立刻获得一些基本能力,如爬坡、跨过障碍、识别和捡起物品。7 月 9 日,Sk

LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程

编辑 | ScienceAI终于,半导体设计行业有了专属的开源大模型!7 月 9 日,国外公司 Aitomatic 宣布推出「Semi Kong」,这是世界上首个专为半导体行业设计的开源 AI 大型语言模型(LLM)。SemiKong 在 2024 年 Semicon West 展会上亮相,旨在彻底改变半导体工艺和制造技术,并有可能在未来五年内重塑价值 5000 亿美元的半导体行业。图示:LeCun 在 X 转发了 SemiKong 内容。(来源:X)Yann LeCun 在 X 转发了这条激动人心的内容:「这是专

AI文档搜索公司Hebbia完成1.3亿美元融资,a16z领投;奥特曼成立AI健康公司;大模型最强架构TTT问世丨AI情报局

融资快报Hebbia 完成 1.3 亿美元融资:位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资,由 a16z 领投,Index Ventures、Google Ventures 以及 Peter Thiel 参投。 据悉,Hebbia 目前估值约为 7 亿美元,公司成立于 2020 年,其软件可分析数字化文档和数据源,包括监管文件、PDF 以及音频和视频剪辑,以帮助客户处理比面向消费者的聊天机器人更复杂的查询,类似 Glean。 旷视科技MEGVII上交所提交注册:旷视科技MEGVII以自研视觉感知算法引擎为核心,致力于持续打造在各商业领域的 AIoT 操作系统,以及深度构建具备连接百亿物联网设备能力的生态系统,为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。

小米黑客马拉松落幕,大模型「智能头盔」获一等奖

本届黑客松上,319 位小米人,产出了 63 个新技术作品。

港大马毅:现在的大模型只有「知识」,没有「智能」

导语:知识与智能是两个概念。 访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law(规模定律)作为信仰并投身其中时,马毅却选择了一条少有人走的路。 「模型无所谓大小,我们说正确的模型,主要看机制是否正确,这才是智能的本质。

开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布

作者 | 上海交通大学、上海人工智能实验室编辑 | ScienceAI近日,上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT(Segment Anything in radiology scans, driven by Text prompts),在3D医学图像(CT、MR、PET)上,基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。论文链接:::、手术规划和疾病监测等一系列临床任务中都有重要作用。然而,传统的研究针对每个特定的分割任务训练「专用」模型,导致

启明创投发布2024生成式AI十大展望

7月6日,由启明创投主办的2024世界人工智能大会(WAIC)“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”在上海世博中心红厅成功举办。 大语言模型、多模态模型、具身智能和生成式AI应用领域的著名专家与学者,顶尖投资人和领军创业者汇聚一堂,围绕生成式AI基础技术进展、商业应用前景和创业投资生态等主题展开分享与交流。 启明创投从2013年开始系统性布局人工智能领域,从AI 1.0到AI 2.0,经过十余年的深耕与前沿洞察,启明创投在AI领域投资了众多项目,多家上市或成长为独角兽企业。

100天后,阶跃星辰交出了第二份答卷

今年 3 月,「借着」 2024 全球开发者先锋大会的场子,「国内最后一家通用大模型公司」——阶跃星辰发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版,正式进入大众视野,并成功跻身国内六大大模型独角兽行列。 另外五家分别是月之暗面、智谱、MiniMax、百川、零一万物。 当然,这一份成绩很是亮眼,一举将国内大模型卷到万亿参数赛道(预览版)。

无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业

7月4日,可信大模型公司无限光年(INF)在2024年世界人工智能大会(WAIC)上发布可信光语大模型及其技术报告。 可信光语大模型结合大语言模型与符号推理,有效解决幻觉问题,大幅增强模型可信度,赋能金融服务、医疗诊断等垂直领域,让生成式AI真正成为新质生产力工具。 在“人工智能:科研范式变革与产业发展”主题论坛上,无限光年联合创始人徐盈辉博士表示,幻觉问题是大模型被用作生产力工具的核心挑战之一:如果大模型生成的内容不可控、难以解释,就很难满足专业领域对准确性、可靠性、严谨性的要求。

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践

以大模型为代表的新一代人工智能技术变革仍在加速迭代,为“新质生产力”的发展注入强劲动力,助力产业智能化升级和经济发展。 目前,大模型在产业端,已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景渗透,这个趋势既得益于基础技术的提升与创新实践的探索,也进一步推动着技术变革与实践深化。 由世界人工智能大会组委会办公室指导,新一代人工智能产业技术创新战略联盟(AITISA)主办,蚂蚁集团承办的“可信大模型助力产业创新发展论坛”,将于7月5日在上海·世博中心金厅举行。

计算效率提升100倍以上,上交李金金团队开发基于Transformer的大模型用于从头算分子动力学

作者 | 陶科豪编辑 | 白菜叶精确模拟原子与分子的动态行为对于开发新一代高效能材料至关重要。然而,传统的从头算分子动力学(AIMD)模拟虽然提供了高精度的预测能力,但由于其高昂的计算成本和漫长的模拟时间,大大限制了研究的进度。例如,完成一个含 100 个原子的材料系统的 30 皮秒模拟,常常需要数月时间,这对于需要快速迭代和优化的新材料研发构成了巨大挑战。在这种背景下,一个能够显著加快这一过程的人工智能模型具有重要价值。面对这些挑战,上海交通大学人工智能与微结构实验室(AIMS-lab)开发了名为 T-AIMD

全球科技巨头集体「卷」AI,华为又在憋什么大招?

生成式 AI 的竞争,今年更加激烈了。今年 5 月以来,全球科技巨头们不约而同地开始展示在 AI 领域的最新成果和战略部署,一系列引人瞩目的发布和合作活动相继展开,预示着 AI 技术的快速发展和广泛应用。5 月 15 日,谷歌推出了 Gemini 1.5 Pro 和 Gemini 1.5 Flash 两款新的大型语言模型,并发布了声称效果超过 GPT-3 的生成视频模型 Veo。微软在 Build 2024 开发者大会上发布了 50 多项与 AI 相关的更新,包括 Team Copilot、Microsoft Fa

共话大模型技术进展与挑战,CCF大模型论坛北京会议圆满落幕!

2024 年 6 月 6 日中国计算机学会大模型论坛(CCF FoLM)主题会议在北京顺利举办。 本次会议主题为“大模型技术进展与挑战”,各位专家围绕大模型技术的前沿动态、发展趋势及技术挑战等议题展开深入探讨,为广大从业者、研究者提供了一场丰富的学术盛宴。 本次会议还宣布了“CCF 大模型安全挑战赛”的正式启动!

价格战之后,智谱来到商业化的下一站

这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表。 面对这场突如其来的价格战,大家讨论最多的是,创业公司很难承受得住这样的比拼。 相比互联网大厂底子厚、钱多,大模型创业公司跟大厂打价格战,风险很大,一些人认为「价格战」是大模型玩家的淘汰加速赛。

1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种

编辑 | 萝卜皮不久之前,Google DeepMind 发布了 AlphaFold3,再次引发了人们对「AI 生命科学」的讨论。在学界,科学家的目标往往是先认识世界,然后在认识的基础上改造世界。但是在生命科学领域,人类对整个生命的理解与认识还如九牛一毛、冰山一角;建立对生命系统的多维度深刻认识是当前人类研究的重要一步,AI 是达成这一步的重要工具。近期,阿里云飞天实验室发布并开源了业界首个联合 DNA、RNA、蛋白质的生物大模型「LucaOne」。这是一种新型预训练基础模型,旨在综合学习遗传和蛋白质组语言,涵