理论

iPhone、Mac上都能跑,刷屏的Llama 2究竟性能如何?

昨天凌晨,相信很多人都被 Meta 发布的 Llama 2 刷了屏。OpenAI 研究科学家 Andrej Karpathy 在推特上表示,「对于人工智能和 LLM 来说,这确实是重要的一天。这是目前能够把权重提供给所有人使用的最为强大的 LLM。」

一个开源方案,极速预训练650亿参数LLaMA

Colossal-AI开箱即用,更加高效。

思考一下,联邦学习可以训练大语言模型吗?

满足在垂直领域中的应用需求,能用联邦学习训练LLM吗?

将上下文长度扩展到 256k,无限上下文版本的OpenLLaMA来了?

大语言模型处理上下文 token 的能力,是越来越长了。

华为基于AI「盘古气象」登Nature!比全球最好的数值天气预报系统IFS快10000倍以上

编辑 | 子罗天气预报早已融入人们的生活,但天气预报的数据从何而来,如何提高其准确性,AI 如何发挥其作用?天气预报是科学计算的重要应用,旨在预测未来的天气变化,特别是极端天气事件。目前,最准确的预报系统是数值天气预报(NWP)方法,它将大气状态表示为离散网格,并数值求解描述这些状态之间转变的偏微分方程。然而,这个过程的计算成本很高。最近,基于 AI 的方法已将天气预报速度提高几个数量级,但预报精度仍然明显低于数值天气预报方法。今年 4 月份,上海人工智能实验室发布「风乌」大模型,全球气象有效预报时间首破 10天。

上交大&上海AI lab研发胸部X-ray疾病诊断基础模型,成果入选Nature子刊

上海交通大学与上海人工智能实验室联合团队聚焦医学人工智能,提出了首个基于医学领域知识增强的 Chest X-ray 的基础模型。

单细胞生物学基础大型语言模型scGPT更新版来了,在超3300万个细胞上进行预训练

编辑 | 紫罗就在前不久,多伦多大学研究团队发布首个单细胞生物学基础大型语言模型:scGPT,其在超 1000 万个细胞上进行预训练。现在,该研究团队首次尝试对超过 3300 万个细胞进行生成预训练来更新 scGPT。论文的通讯作者、多伦多大学助理教授 Bo Wang 在推特激动发文:「令人兴奋的 scGPT 更新:自 4 月份发布以来,受到社区的极大关注,我们很高兴地宣布单细胞多组学数据的基础模型 scGPT 的首次重大更新。」更新后的研究以「scGPT: Towards Building a Foundatio

大型语言模型与知识图谱协同研究综述:两大技术优势互补

多图综述理清当前研究现状,这篇 29 页的论文值得一读。

第一个超越ChatGPT的开源模型来了?网友并不买账

开源模型真的超过 ChatGPT了吗?

坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」

企业被放在了开往大模型时代列车的驾驶座上。

深入学习生成式AI,吴恩达推荐了一门新课程

跟上步伐,别掉队,速来学习LLM。

DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率

。ZeRO++ 相比 ZeRO 将总通信量减少了 4 倍,而不会影响模型质量。

像相机一样变焦、填充画面细节,还能自定义风格,AI作画神器Midjourney又更新了

这次,Midjourney 5.2 又给用户带来了新的惊喜!

超越所有开源模型,击败 Claude、Bard,专门用于编程任务的大模型来了

开源 LLM 的性能越来越好了。

大模型进入「落地战」,腾讯云下手「行业」大模型

将行业需求转化为大模型课题。

百川智能发布开源中英文大模型,多个榜单评测成绩最佳

王小川创立的百川智能发布中英文大模型,采用开源模式,可免费商用。报道 | 机器之能2023年6月15日,被称为「中国ChatGPT梦之队」的百川智能公司,推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Sc

如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》

研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。

无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步

当下 OVD 领域的相关研究蓬勃发展,OVD 技术对未来通用 AI 大模型能够带来的改变值得期待。