大模型

UniReal登场：用视频架构统一图像生成与编辑，还学到真实世界动态变化规律

论文一作陈汐，现为香港大学三年级博士生，在此之前本科硕士毕业于浙江大学，同时获得法国马赛中央理工双硕士学位。主要研究方向为图像视频生成与理解，在领域内顶级期刊会议上发表论文十余篇，并且 GitHub 开源项目获得超过 5K star.本文中，香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中，通过将不同类别和数量的输入/输出图像建模为视频帧，从大规模真实视频数据中学习属性、姿态、光照等多种变化规律，从而实现高保真的生成效果。

12/20/2024 1:50:00 PM

机器之心

智源发布FlagEval「百模」评测结果，丈量模型生态变局

2024 年 12 月 19 日，智源研究院发布并解读国内外 100 余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。相较于今年 5 月的模型能力全方位评估，本次智源评测扩展、丰富、细化了任务解决能力内涵，新增了数据处理、高级编程和工具调用的相关能力与任务；首次增加了面向真实金融量化交易场景的应用能力评估，测量大模型的收益优化和性能优化等能力；首次探索基于模型辩论的对比评估方式，对模型的逻辑推理、观点理解、语言表达等核心能力进行深入分析。智源评测发现，2024 年下半年大模型发展更聚焦综合能力提升与实际应用。

12/20/2024 1:20:00 PM

机器之心

释放数字金融向新力，奇富科技金融AI大模型成果落地上海金融科技国际论坛特展周活动

12 月 19 日，在第六届上海金融科技国际论坛之“2024年度人工智能大模型金融领域示范场景及创新应用案例成果特展”活动周上，由上海金融科技产业联盟创新监管联合实验室指导，奇富科技主办的“攻坚金融科技创新与大模型应用、释放数字金融向新力” 主题成果展在沪举办，全面展示了奇富科技在金融科技领域的创新实践。同时，上海金融科技产业联盟创新监管实验室与奇富科技现场达成创新伙伴合作，双方将共同探索金融科技创新的路径，推动新技术在金融领域高效、安全的应用，助力上海全球金融科技中心建设。奇富科技CEO吴海生在特展现场强调，科技是驱动金融创新的关键，能打破传统边界，以智能化、个性化方案满足多元化金融需求。

12/20/2024 11:49:00 AM

新闻助手

突破自动驾驶视频生成极限：港中文&港科大&华为联手推出MagicDriveDiT

可控视频生成，对于自动驾驶技术而言，同样非常重要。比如，生成高质量、长时间且可控的高质量街景视频，可以满足开发自动驾驶应用的数据缺口。现在，香港中文大学、香港科技大学和华为联手向这一长期挑战发起了冲锋：推出MagicDriveDiT，重新定义自动驾驶视频生成的标准。

12/20/2024 9:30:00 AM

量子位

腾讯云 ES：一站式 RAG 方案，开启智能搜索新时代

在大型语言模型（LLM）引领的革命浪潮中，搜索与大模型的紧密结合已成为推动知识进步的关键要素。作为开源搜索引擎排名第一的 Elasticsearch（ES），结合沉淀多年的文本搜索能力和强大的向量检索能力实现混合搜索，使搜索变得更准、更全、更智能。腾讯云 ES 多年来持续对开源 ES 的性能、成本、稳定性以及分布式架构进行深度增强优化，并在海量规模的云业务中接受考验。

12/20/2024 8:13:06 AM

黄国航

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

12/20/2024 7:58:12 AM

故渊

腾讯版Sora开源后，被提速八倍！官方点赞并预告：下月上新图生视频

提速8倍！速度更快、效果更好的混元视频模型——FastHunyuan来了！新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。

12/20/2024 7:00:00 AM

智源发布FlagEval“百模”评测结果丈量模型生态变局

2024年12月19日，智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。相较于今年5月的模型能力全方位评估，本次智源评测扩展、丰富、细化了任务解决能力内涵，新增了数据处理、高级编程和工具调用的相关能力与任务；首次增加了面向真实金融量化交易场景的应用能力评估，测量大模型的收益优化和性能优化等能力；首次探索基于模型辩论的对比评估方式，对模型的逻辑推理、观点理解、语言表达等核心能力进行深入分析。智源评测发现，2024年下半年大模型发展更聚焦综合能力提升与实际应用。

12/19/2024 6:00:00 PM

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

原来AI有能力把研究员、用户都蒙在鼓里：在训练阶段，会假装遵守训练目标；训练结束不受监控了，就放飞自我。还表现出区别对待免费用户和付费用户的行为。甚至假装给Claude一个机会去反抗Anthropic公司，它会尝试去窃取自己的权重？

12/19/2024 5:52:27 PM

对齐、生成效果大增，文本驱动的风格转换迎来进阶版

论文的第一作者是来自西湖大学的研究人员雷明坤，指导老师为西湖大学通用人工智能（AGI）实验室的负责人张驰助理教授。实验室的研究方向聚焦于生成式人工智能和多模态机器学习。文本驱动的风格迁移是图像生成中的一个重要任务，旨在将参考图像的风格与符合文本提示的内容融合在一起，生成最终的风格化图片。

12/19/2024 2:30:00 PM

机器之心

震惊！Claude伪对齐率竟能高达78％，Anthropic 137页长论文自揭短

今天，大模型公司 Anthropic 的一篇 137 页长论文火了！该论文探讨了大语言模型中的「伪对齐」，通过一系列实验发现：Claude 在训练过程中经常假装有不同的观点，而实际上却保持了其原始偏好。这一发现说明了大模型可能具备了类似于人类的属性与倾向。

12/19/2024 1:30:00 PM

机器之心

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的 Gemini 回复

据 TechCrunch 报道，谷歌针对其大型语言模型 Gemini 回复的外包评估流程进行了一项调整，引发了外界对其在敏感领域信息准确性的担忧。这项调整要求外包评估员不得再像以往那样，因自身专业知识不足而跳过某些特定的评估任务，这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。

12/19/2024 10:19:53 AM

远洋

图森未来正式更名为CreateAI，并发布多项重大进展

2024年12月19日 - 图森未来（TuSimple）今日正式启用全新品牌CreateAI，并发布多项在生成式AI领域的重大进展。 CreateAI宣布获著名武侠IP《金庸群侠传》正版授权，将开发一款大型武侠开放世界RPG游戏。 CreateAI还将与著名动画导演河森正治，以及顶级动画制作公司株式会社白组展开合作，利用AIGC技术推动创作者在展示宏大宇宙文明方面实现更多突破。

12/19/2024 9:58:00 AM

新闻助手

美媒：一些中国大模型已经追平甚至超越美国产品

CNBC报道称，中国想在AI领域成为统治者，这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为，中国AI模型已经相当流行，从性能角度看，中国的一些模型与美国产品齐头并进，甚至超越。由于无法采购美国先进AI芯片，中国只能寻找其它办法增强AI模型性能，比如依赖开源技术，开发自主软件和芯片。

12/18/2024 3:34:07 PM

小刀

Scaling Law撞墙？预训练终结？亚马逊云科技为什么还在做基础大模型

12 月 2-6 日，亚马逊云科技在美国拉斯维加斯举办了今年度的 re:Invent 大会。会上，亚马逊云科技发布了相当多东西，其中之一便是新的大模型系列 Nova。说实话，这确实出乎了相当多人的意料 —— 毕竟亚马逊已经重金押注 Anthropic，似乎没有必要再自起炉灶了。

12/18/2024 1:40:00 PM

机器之心

见证历史！AI想的科研idea，真被人类写成论文发表了

天啦撸！！ AI想出来的idea，还真有人写成论文了。

12/18/2024 1:30:00 PM

量子位

大模型超强内存优化：成本削减高达75%，性能不减弱！成果出自日本一初创AI公司之手；网友：电力可能够用了！

出品 | 51CTO技术栈（微信号：blog51cto）一项逆天的大模型优化技术来了！东京初创公司Sakana AI的研究人员开发了一种新技术，让大模型能够更有效地使用内存，不仅最多节省75%的内存占用，还甚至性能也有所提升！这种名为“通用Transformer内存”的技术使用特殊的神经网络优化LLM，保留重要的信息并丢弃冗余的细节。

12/18/2024 1:24:55 PM

百度关于大模型在研发领域落地的深度思考

一、智能研发工具的发展首先来看一下智能研发工具的发展历程和方向。智能化的发展背景与落地诉求早期的智能化工具，如 GitHub 的 Copilot 工具，大约在两年半前推出。最初，Copilot 的主要功能是在开发者编写代码时提供自动补全建议。

12/18/2024 8:33:01 AM

张立理

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

大模型

UniReal登场：用视频架构统一图像生成与编辑，还学到真实世界动态变化规律

智源发布FlagEval「百模」评测结果，丈量模型生态变局

释放数字金融向新力，奇富科技金融AI大模型成果落地上海金融科技国际论坛特展周活动

突破自动驾驶视频生成极限：港中文&港科大&华为联手推出MagicDriveDiT

腾讯云 ES：一站式 RAG 方案，开启智能搜索新时代

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

腾讯版Sora开源后，被提速八倍！官方点赞并预告：下月上新图生视频

智源发布FlagEval“百模”评测结果 丈量模型生态变局

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

对齐、生成效果大增，文本驱动的风格转换迎来进阶版

震惊！Claude伪对齐率竟能高达78％，Anthropic 137页长论文自揭短

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的 Gemini 回复

图森未来正式更名为CreateAI，并发布多项重大进展

美媒：一些中国大模型已经追平甚至超越美国产品

Scaling Law撞墙？预训练终结？亚马逊云科技为什么还在做基础大模型

见证历史！AI想的科研idea，真被人类写成论文发表了

大模型超强内存优化：成本削减高达75%，性能不减弱！成果出自日本一初创AI公司之手；网友：电力可能够用了！

百度关于大模型在研发领域落地的深度思考

智源发布FlagEval“百模”评测结果丈量模型生态变局