无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业

7月4日,可信大模型公司无限光年(INF)在2024年世界人工智能大会(WAIC)上发布可信光语大模型及其技术报告。 可信光语大模型结合大语言模型与符号推理,有效解决幻觉问题,大幅增强模型可信度,赋能金融服务、医疗诊断等垂直领域,让生成式AI真正成为新质生产力工具。 在“人工智能:科研范式变革与产业发展”主题论坛上,无限光年联合创始人徐盈辉博士表示,幻觉问题是大模型被用作生产力工具的核心挑战之一:如果大模型生成的内容不可控、难以解释,就很难满足专业领域对准确性、可靠性、严谨性的要求。

7月4日,可信大模型公司无限光年(INF)在2024年世界人工智能大会(WAIC)上发布可信光语大模型及其技术报告。可信光语大模型结合大语言模型与符号推理,有效解决幻觉问题,大幅增强模型可信度,赋能金融服务、医疗诊断等垂直领域,让生成式AI真正成为新质生产力工具。

在“人工智能:科研范式变革与产业发展”主题论坛上,无限光年联合创始人徐盈辉博士表示,幻觉问题是大模型被用作生产力工具的核心挑战之一:如果大模型生成的内容不可控、难以解释,就很难满足专业领域对准确性、可靠性、严谨性的要求。

针对该挑战,无限光年致力于研发神经符号计算等多种创新技术,并在此基础上打造新一代可信大模型。

徐盈辉博士介绍,人工智能在多年发展长河中形成了符号学派和联结学派两种不同的路径和理念。神经符号技术将符号学派的推理能力与联接学派的学习能力有机结合,大幅提升生成式AI在行业应用中的可信生成能力,降低错误率、提高可靠性。正如诺贝尔经济学奖得主丹尼尔·卡尼曼提出的“人类思维有快与慢两个系统”的理论,符号计算与大模型的结合不仅能用神经网络实现快速的“黑盒”概率预测,更能进行慢思考的“白盒“逻辑推理。这两个系统的融合代表着通往未来通用人工智能(AGI)的重要技术方向,也正是无限光年独特的“灰盒“可信路线。

无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业无限光年联合创始人徐盈辉博士在2024年WAIC上发布光语垂直领域大模型

无限光年积极发展“灰盒”大模型,解决垂直领域的专业问题。

在金融领域,特许金融分析师(Chartered Financial Analyst,CFA)考试是全球投资业最严格、含金量最高的资格认证,分为三级考试,包含丰富的金融类知识问题和计算推理问题。基于CFA数据集,无限光年金融大模型在一级和二级考试中准确率均超过GPT4-Turbo和Llama3。在一级和二级考试准确率的表现上,无限光年金融大模型得分分别为0.7772和0.5518,GPT4-Turbo分别为0.7177和0. 5259,Llama3分别为0.6723和0.4812。

同时,在公开数据集FinanceIQ和Fin-Eval上,无限光年金融大模型的表现也均超过GPT4-Turbo和Llama3。徐盈辉博士同时宣布,无限光年将光语金融大模型API试用,助力大模型在金融行业的发展和应用。

无限光年发布光语大模型,以灰盒可信技术深耕专业场景,赋能千行百业无限光年光语大模型在垂直领域测试超越OPENAI的万亿参数大模型

此外,光语大模型在4个公开的权威逻辑推理数据集上准确率都超过GPT-4 Turbo,在ProofWriter、FOLIO、ProntoQA和MedExam Grading中的得分分别为0.99、0.58、0.99和0.80,而GPT4分别为0.91、0.56、0.94和0.64。

在医疗领域,无限光年医疗大模型在权威医疗数据集MedBench上,API和自测榜双榜第一,是首家双榜超过90分的医疗大模型。API榜综合得分90.4。

自成立以来,基于可信大模型技术,无限光年已在大模型产业应用中取得多方面成果。在金融领域,无限光年与头部证券公司合作推出AI投研助手。借助新一代可信技术,这一投研助手在国内率先实现了用大模型精准、高效、深度解读企业财报,为分析师等专业人士提供包括信息总结分析、范式写作和精准搜索在内的一站式功能。到目前为止,该产品已被多家证券公司和资管机构使用。

在医疗领域,无限光年与国内头部三甲医院合作,共同基于可信技术创新打造医疗行业大模型,在体检报告解读方面有效协助医生提升报告效率和准确度。

徐盈辉博士认为,在经历“百模大战”后,模型的行业应用已成为大模型的发展重心。但在深入专业化场景时,当前通用大模型的表现并不理想。无限光年团队将持续探索新一代可信的灰盒大模型技术,让垂直领域大模型更精准、更可信,成为“金融顾问” 、“专业医生”和更多领域的专家,让AI技术人人可用、行行受益。

据了解,无限光年团队既有来自阿里巴巴、蚂蚁集团、字节跳动、微软的国际顶尖AI人才,也有来自摩根大通等金融机构、协和医院等医疗机构的资深行业专家。基于对行业需求的深入了解,无限光年开发AI原生产品与解决方案,为行业提供多元化的专业服务,推动“灰盒大模型”和生成式AI技术在行业场景的持续落地。此前,无限光年已完成多轮融资,投资人包括阿里云、启明创投等头部投资机构。

(公司最新发布技术报告下载链接:https://s.infly.cn/f/img/pdf/Towards_Trustworthy_LLMs.pdf?20240703)

 

相关资讯

2024WAIC热议大模型助力产业新趋势,可信应用成焦点

作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。 过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI、谷歌、苹果,到国内的阿里巴巴、字节跳动、腾讯等一众企业纷纷出新,还不约而同地选择将大模型技术落地到产业应用之中。 AI 企业们似乎都在向世界宣告:科幻电影中的 AGI 将成现实。

Nature子刊,上智院、复旦、中国气象局研发次季节AI大模型「伏羲」,突破「可预报性沙漠」

编辑 | ScienceAI作者 | 伏羲团队国务院印发的《气象高质量发展纲要(2022—2035 年)》明确提出要「提前一个月预报重大天气过程」,而这离不开 15 天以上的次季节气候预测技术。次季节气候预测关注的是未来 15~60 天的气候异常,可以为农业、水利、能源等领域的生产安排提供重要支撑。相比时效在两周以内的中短期天气预报,次季节气候预测的不确定性更大。它不仅需要考虑初值问题,还要考虑边界强迫的影响,预测来源更为复杂,预测技巧也较少。因此,次季节气候预测一直被称为「可预报性沙漠」,由于其复杂性,甚至连 A

优刻得为智谱AI构建千卡推理集群,助力全球用户畅享大模型智能生活

时光倒回到 2021 年的那个夜晚。一位妈妈灵感枯竭,无法继续她的小说创作;一旁的爸爸正忙碌于代码的世界,他想要在工作之余开发一款小游戏,却困于代码调试;而他们的孩子,正眉头紧锁地趴在书桌上,为一道奥数题苦思冥想。2024 年的今天,AI 大模型的出现让这一切发生改变。在「智谱清言」的助力下,妈妈的小说创作焕发新生,她只需将自己的创意和构思输入给大模型,就可以生成自然生动的故事情节和对话;爸爸用大模型进行代码编程和调试,通过分析代码逻辑,大大减少了开发的繁琐流程,减轻了一大半的⼯作量;大模型也成为了小朋友学习上的得