AIGC宇宙 AIGC宇宙

大模型

大型语言模型与知识图谱协同研究综述:两大技术优势互补

多图综述理清当前研究现状,这篇 29 页的论文值得一读。
7/3/2023 2:58:00 PM
机器之心

坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」

企业被放在了开往大模型时代列车的驾驶座上。
7/3/2023 2:27:00 PM
机器之心

深入学习生成式AI,吴恩达推荐了一门新课程

跟上步伐,别掉队,速来学习LLM。
6/29/2023 5:01:00 PM
机器之心

DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率

。ZeRO++ 相比 ZeRO 将总通信量减少了 4 倍,而不会影响模型质量。
6/24/2023 12:51:00 PM
机器之心

超越所有开源模型,击败 Claude、Bard,专门用于编程任务的大模型来了

开源 LLM 的性能越来越好了。
6/20/2023 2:34:00 PM
机器之心

大模型进入「落地战」,腾讯云下手「行业」大模型

将行业需求转化为大模型课题。
6/20/2023 2:14:00 PM
机器之心

百川智能发布开源中英文大模型,多个榜单评测成绩最佳

王小川创立的百川智能发布中英文大模型,采用开源模式,可免费商用。报道 | 机器之能2023年6月15日,被称为「中国ChatGPT梦之队」的百川智能公司,推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Sc
6/15/2023 6:13:00 PM
机器之能

无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步

当下 OVD 领域的相关研究蓬勃发展,OVD 技术对未来通用 AI 大模型能够带来的改变值得期待。
6/5/2023 3:24:00 PM
机器之心

陈天奇官宣新APP,让手机原生跑大模型,应用商店直接下载使用

IPhone、iPad 均可体验。
6/5/2023 3:06:00 PM
机器之心

OpenAI、谷歌双标玩得溜:训练大模型用他人数据,却决不允许自身数据外流

你的就是我的,我的还是我的。
6/4/2023 12:35:00 PM
机器之心

5 个章节、25 条规范,全方位 Get 数据集选择与创建的「百科全书」

内容一览:如果你正在学习如何创建或选择一个合适的数据集,那么这篇文章会给你一些实用的建议,帮助你在选择和创建数据集时做出明智的决策。 关键词:机器学习 数据集
6/2/2023 9:49:00 AM
HyperAI超神经

有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义

大型语言模型能否捕捉到它们所处理和生成的文本中的语义信息?这一问题在计算机科学和自然语言处理领域一直存在争议。然而,MIT的一项新研究表明,仅基于文本形式训练、用于预测下一个token的语言模型确实能学习和表示文本的意义。
5/22/2023 2:33:00 PM
机器之心

大模型迎来「开源季」,盘点过去一个月那些开源的LLM和数据集

前段时间,谷歌泄露的内部文件表达了这样一个观点,虽然表面看起来 OpenAI 和谷歌在 AI 大模型上你追我赶,但真正的赢家未必会从这两家中产生,因为有一个第三方力量正在悄然崛起。这个力量就是「开源」。
5/16/2023 2:53:00 PM
机器之心

​GPT充当大脑,指挥多个模型协作完成各类任务,通用系统AutoML-GPT来了

使用 ChatGPT 实现通用人工智能,思路打开了。
5/15/2023 3:04:00 PM
机器之心

首个单细胞生物学基础大型语言模型,在超1000万个细胞进行预训练

编辑 | 紫罗生成式预训练模型在自然语言处理(NLP)和计算机视觉等领域取得了显著的成功。文本是由文字组成的,细胞可以用基因来表征。NLP 和单细胞生物学之间的另一个核心相似之处是,用于训练的公开可用的单细胞 RNA 测序(scRNA-seq)数据的规模庞大且不断增长。NLP 模型是否也能理解单细胞生物学的内在逻辑并发展「涌现思维」?近日,来自加拿大多伦多大学和彼得·蒙克心脏中心(Peter Munk Cardiac Centre)的研究人员,通过利用呈指数增长的单细胞测序数据,首次尝试对超过 1000 万个细胞进
5/9/2023 11:29:00 AM
ScienceAI

三维ImageNet开源!港中深韩晓光团队助力计算机视觉进入三维大数据时代

随着深度学习技术的快速发展,数据驱动的方法已成为计算机视觉领域的核心。在过去的十年里,随着 ImageNet 诞生之后,计算机视觉领域见证了 “从数据中学习” 的范式的兴盛。在 ImageNet 上进行预训练,然后迁移到下游的视觉任务,都能显著提升模型性能,并且已经成为 2D 图像领域的标准化方式。
5/1/2023 5:12:00 PM
机器之心

平息画师怒火:Stable Diffusion学会在绘画中直接「擦除」侵权概念

Stable Diffusion 学会了「偷天换日」的本领。
4/7/2023 8:46:00 PM
机器之心