文章列表

OpenAI 让 ChatGPT“耳聪目明”:语音视觉双剑合璧,AI 交互体验再升级

“OpenAI 12 天”活动已进入第六天,OpenAI 公司宣布为 ChatGPT 的高级语音模式带来视频输入和屏幕共享功能,并为迎接圣诞节,限时推出全新的圣诞老人模式。

容联云举办数智金融应用论坛,探索AI能力落地金融“营销服”

12月12日,容联云举办“步进·新金融”2024数智金融应用论坛。 大会聚焦运营、营销、服务等金融业务应用场景,共同探讨金融行业数智化转型的最佳实践和大模型应用创新成果。 现场嘉宾通过真实的案例与数据呈现金融行业数智化转型带来的实际成效,与生态伙伴共同推动数智金融的高质量发展。

OpenAI犯了大公司病

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)OpenAI第五天直播,小编只能说,这次没什么特别new的新闻,更像是一个苹果和OpenAI的联合发布吧。 本来一个事情,苹果说更新的iOS18.2系统集成了ChatGPT,放到OpenAI这边,自然会说ChatGPT集成到了iPhone、iPad、Mac中。 总结起来,值得一看的是三种场景:一、Siri对话:Siri会判断什么时候更适合ChatGPT回答,适当时会让ChatGPT来处理,当然处于保护用户隐私的考虑,这时会需要用户点击确认。

宕机超 4 小时后,OpenAI 宣布 ChatGPT、Sora 服务故障已全面修复

北京时间12月12(今)日下午,OpenAI更新事故报告称,API、ChatGPT和Sora服务现已全面恢复运行。此次故障持续约4小时10分钟。OpenAI表示,将对此次故障进行全面的根本原因分析。

OpenAI推出适用于iPhone的ChatGPT,与Apple实现具有里程碑意义的AI整合

在iOS 18.2向用户推送的周三,OpenAI展示了其新款iPhone集成功能,将ChatGPT直接融入Siri、写作工具和相机功能中。 在OpenAI“Shipmas 12天”产品发布的第五天展示的这项功能更新,标志着苹果罕见地向外部软件开放了其核心iPhone功能。 ChatGPT现在可以通过Siri处理命令,并在整个操作系统中处理任务。

谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放

谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。

OpenAI 就 ChatGPT 宕机致歉:部分服务已恢复,Sora 仍为瘫痪状态

北京时间今日9时50分,该公司进一步更新事故报告称,正在继续进行修复工作。API和ChatGPT服务部分恢复,Sora仍处于瘫痪状态。

OpenAI ChatGPT 全球范围内宕机,苹果 iOS 18.2 Siri 受牵连

OpenAI 已证实其人工智能聊天机器人 ChatGPT 目前正经历全球范围的宕机,导致用户无法使用。这一问题也影响了 iOS 18.2 与 Siri 的集成功能。

豆包 Marscode 优秀实践

毫无疑问,Marscode 能解决非常多基础问题,特别对于编程新手而言,它能相对准确地生成各种代码,完成编程任务,但其底层并不神秘,本质上就是在传统 IDE 基础上,搭配足够好的交互与足够好的 LLM,从而超越传统 IDE。 交互方面,它在 VS Code 基础上,补充提供了:提供了几乎毫无门槛的代码自动补全能力,并且支持多行编辑,这在一些场景,如修改变量名时,非常好用。 行内、独立问答面板,可用于快速解答问题。

谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议

谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”

如何在安卓手机上本地安装和运行LLM?

译者 | 布加迪审校 | 重楼了解如何将AI的力量径直带入到你的安卓手机上:没有云,没有互联网,只有纯粹的设备端智能! 在安卓手机上本地运行大语言模型(LLM)意味着你可以在不依赖云服务器或互联网连接的情况下访问人工智能(AI)模型。 这种本地环境通过确保数据安全、并在设备端来确保隐私。

OpenAI下一代模型突遭泄露!「半GPT-5」旗舰模型猎户座要来了?

OpenAI的新模型,竟被意外泄露了? 圣诞马拉松第四天,网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里,发现了蛛丝马迹。 一个名叫「ChatGPT ε」的模型,现身了。

谷歌深夜炸场:Gemini 2.0 正式发布,号称迄今智能体时代最有能力的 AI 模型

谷歌正式发布Gemini 2.0,号称迄今为止为智能体时代最有能力的AI模型,带来了增强的性能、更多的多模态性和新的原生工具使用。

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题

在人工智能领域,我们一直以为顶尖的多模态大模型已经无所不能,GPT-4o在ASR(音频转文字)任务上已经达到了97%的正确率,更是凸显了强大的音频理解能力。 然而,最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小! 下面是一个例子:结果让人难以置信:这些顶尖的AI模型都未能准确判断出音量的差异!

YouTube 自动配音功能推广至更多知识类频道,借助 AI 生成视频多语言配音

YouTube当地时间周二宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。

OpenAI员工意外泄露下一代ChatGPT!网友:故意的还是不小心的?

OpenAI员工发推介绍今天发布的新功能,结果意外泄露了未发布的模型? 在Reddit上,被列文虎克附体的网友发现,OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字——ChatGPT ε(第五个希腊字母,读作Epsilon)。 这名网友猜测,这极可能就是之前被传出的下一代模型“猎户座”。

面壁智能获新一轮数亿元融资,高效端侧智能持续引领行业发展

近日,面壁智能完成新一轮数亿元融资,本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投,万甲资本担任本轮独家财务顾问。 本轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。 面壁智能是以「高效为第一性原理」的大模型公司。