大模型

MIT 开发深度化学模型的神经尺度策略，发现「神经尺度」定律

编辑 | 绿萝在数据可用性和计算方面，大规模使得自然语言处理和计算机视觉等深度学习关键应用领域取得了重要突破。越来越多的证据表明，规模可能是科学深度学习的关键因素，但物理先验在科学领域的重要性使得规模化的策略和收益变得不确定。近日，来自 MIT 的研究团队通过将模型和数据集大小改变多个数量级来研究大型化学模型中的神经尺度（neural-scaling）行为，研究具有超过 10 亿个参数的模型，并在多达 1000 万个数据点的数据集上进行预训练。研究考虑用于生成化学的大型语言模型和用于机器学习原子间势的图神经网络。研

11/13/2023 3:02:00 PM

ScienceAI

MIT研究人员将Transformer与图神经网络结合，用于设计全新蛋白质

编辑 | 萝卜皮凭借其复杂的排列和动态功能，蛋白质通过采用简单构建块的独特排列（其中几何形状是关键）来执行大量的生物任务。将这个几乎无限的排列库转化为各自的功能，可以方便研究人员设计用于特定用途的定制蛋白质。麻省理工学院（MIT）的 Markus Buehler 提出了一种灵活的基于语言模型的深度学习策略，将 Transformer 与图神经网络结合起来，以更好地理解和设计蛋白质。「通过这种新方法，我们可以通过对基本原理进行建模，利用大自然发明的一切作为知识基础。」Buehler 说，「该模型重新组合了这些自然构建

9/12/2023 6:02:00 PM

ScienceAI

700 亿参数 LLaMA2 训练加速 195%，基础大模型最佳实践再升级

提供开箱即用的8到512卡LLaMA2训练、微调、推理方案。

9/4/2023 4:43:00 PM

机器之心

致命幻觉问题、开发GPU替代品，大模型还面临这10大挑战

ChatGPT、GPT-4 等的发布，让我们在见识到大模型（LLM）的魅力后，伴随而来的是其所面临的各种挑战。如何让 LLM 变得更好？面对大模型，到底有哪些需要解决的问题？成为 AI 领域重要的研究课题。

8/27/2023 8:28:00 PM

机器之心

GPT-4、ChatGLM2、Llama2、PaLM2在KDD LLM Day上一起开了个会

大语言模型（Large Language Models）的发展势头愈发猛烈，各大公司国际角逐的背后，也需要一同应对公平、安全以及隐私等方面的问题。

8/11/2023 2:32:00 PM

机器之心

OpenAI公布「官方爬虫」：GPT-5靠它训练，有需要可以屏蔽

众所周知，OpenAI 从 GPT-4 开始就已经对技术细节完全保密了，最初只用一份 Tech Report 来展示基准测试结果，而闭口不谈训练数据和模型参数。尽管后来有网友各种爆料，OpenAI 也从未回应。

8/8/2023 2:24:00 PM

机器之心

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

编辑 | 白菜叶人工智能驱动的会话式聊天机器人已经出现在互联网搜索引擎中，例如谷歌的 Bard 和微软的 Bing，看起来也将越来越多地改变科学文献搜索方式。8 月 1 日，荷兰出版巨头 Elsevier 为其 Scopus 数据库的部分用户发布了由 ChatGPT 支持的 AI 界面，而英国公司 Digital Science 则宣布对其 Dimensions 数据库进行 AI 大语言模型 (LLM) 助手的封闭试验。与此同时，美国 Clarivate 公司表示，它也在努力将 LLM 纳入其 Web of Sci

8/6/2023 7:59:00 PM

ScienceAI

爆火Llama 2一周请求下载超15万，有人开源了Rust实现版本

前些天，Meta 发布的免费可商用版本 Llama 2，可谓在 AI 界引起了巨大的轰动。

8/1/2023 3:13:00 PM

机器之心

分析过688篇大模型论文，这篇论文综述了LLM的当前挑战和应用

LLM 面临哪些挑战又有哪些应用？系统性的综述论文来了。

7/31/2023 2:37:00 PM

机器之心

Llama 2 的入门与实战，机器之心邀请了 4 位技术大牛手把手教你

机器之能报道编辑：Sia「Llama 2 大模型算法与应用实践」-机器之心 AI 技术论坛将于 8 月 26 日在北京举办。如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」，并给你列出一长串熊猫的名字。而 AI 圈内的人八成会回答「羊驼」。而且，他们也能给你列出一长串「羊驼」的名字：llama、vicuna、alpaca…… 得益于 Meta Llama 模型的开源，AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍，每个单词都对应着一个（或一组）基于 Llama 的微调模型。这些模

7/30/2023 11:42:00 PM

机器之能

iPhone、Mac上都能跑，刷屏的Llama 2究竟性能如何？

昨天凌晨，相信很多人都被 Meta 发布的 Llama 2 刷了屏。OpenAI 研究科学家 Andrej Karpathy 在推特上表示，「对于人工智能和 LLM 来说，这确实是重要的一天。这是目前能够把权重提供给所有人使用的最为强大的 LLM。」

7/20/2023 2:23:00 PM

机器之心

一个开源方案，极速预训练650亿参数LLaMA

Colossal-AI开箱即用，更加高效。

7/18/2023 2:31:00 PM

机器之心

获星1.9k，LLM微调神器Lamini上演速度与激情，免费可用

LLM 微调不再头疼。

7/16/2023 7:50:00 PM

机器之心

思考一下，联邦学习可以训练大语言模型吗？

满足在垂直领域中的应用需求，能用联邦学习训练LLM吗？

7/10/2023 2:34:00 PM

机器之心

将上下文长度扩展到 256k，无限上下文版本的OpenLLaMA来了？

大语言模型处理上下文 token 的能力，是越来越长了。

7/10/2023 2:23:00 PM

机器之心

华为基于AI「盘古气象」登Nature！比全球最好的数值天气预报系统IFS快10000倍以上

编辑 | 子罗天气预报早已融入人们的生活，但天气预报的数据从何而来，如何提高其准确性，AI 如何发挥其作用？天气预报是科学计算的重要应用，旨在预测未来的天气变化，特别是极端天气事件。目前，最准确的预报系统是数值天气预报（NWP）方法，它将大气状态表示为离散网格，并数值求解描述这些状态之间转变的偏微分方程。然而，这个过程的计算成本很高。最近，基于 AI 的方法已将天气预报速度提高几个数量级，但预报精度仍然明显低于数值天气预报方法。今年 4 月份，上海人工智能实验室发布「风乌」大模型，全球气象有效预报时间首破 10天。

7/6/2023 6:13:00 PM

ScienceAI

上交大&上海AI lab研发胸部X-ray疾病诊断基础模型，成果入选Nature子刊

上海交通大学与上海人工智能实验室联合团队聚焦医学人工智能，提出了首个基于医学领域知识增强的 Chest X-ray 的基础模型。

7/6/2023 5:27:00 PM

机器之心

单细胞生物学基础大型语言模型scGPT更新版来了，在超3300万个细胞上进行预训练

编辑 | 紫罗就在前不久，多伦多大学研究团队发布首个单细胞生物学基础大型语言模型：scGPT，其在超 1000 万个细胞上进行预训练。现在，该研究团队首次尝试对超过 3300 万个细胞进行生成预训练来更新 scGPT。论文的通讯作者、多伦多大学助理教授 Bo Wang 在推特激动发文：「令人兴奋的 scGPT 更新：自 4 月份发布以来，受到社区的极大关注，我们很高兴地宣布单细胞多组学数据的基础模型 scGPT 的首次重大更新。」更新后的研究以「scGPT: Towards Building a Foundatio

7/5/2023 6:11:00 PM

ScienceAI

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

大模型

MIT 开发​深度化学模型的神经尺度策略，发现「神经尺度」定律

MIT研究人员将Transformer与图神经网络结合，用于设计全新蛋白质

700 亿参数 LLaMA2 训练加速 195%，基础大模型最佳实践再升级

致命幻觉问题、开发GPU替代品，大模型还面临这10大挑战

GPT-4、ChatGLM2、Llama2、PaLM2在KDD LLM Day上一起开了个会

OpenAI公布「官方爬虫」：GPT-5靠它训练，有需要可以屏蔽

类似 ChatGPT 的人工智能即将出现在主要科学搜索引擎中

爆火Llama 2一周请求下载超15万，有人开源了Rust实现版本

分析过688篇大模型论文，这篇论文综述了LLM的当前挑战和应用

Llama 2 的入门与实战，机器之心邀请了 4 位技术大牛手把手教你

iPhone、Mac上都能跑，刷屏的Llama 2究竟性能如何？

一个开源方案，极速预训练650亿参数LLaMA

获星1.9k，LLM微调神器Lamini上演速度与激情，免费可用

思考一下，联邦学习可以训练大语言模型吗？

将上下文长度扩展到 256k，无限上下文版本的OpenLLaMA来了？

华为基于AI「盘古气象」登Nature！比全球最好的数值天气预报系统IFS快10000倍以上

上交大&上海AI lab研发胸部X-ray疾病诊断基础模型，成果入选Nature子刊

单细胞生物学基础大型语言模型scGPT更新版来了，在超3300万个细胞上进行预训练

MIT 开发深度化学模型的神经尺度策略，发现「神经尺度」定律