腾讯微信正式发布多模态大模型 POINTS 1.5

作者：问舟

2024-12-14 07:02

据官方介绍，这一代 POINTS 模型，不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想，同时极大了增强了模型的性能。

感谢距离 POINT1.0 的发布已经过去两个月的时间，腾讯今天宣布推出 POINTS1.5。

AI在线注意到，POINTS1.5 仍然沿用了 POINTS1.0 中使用的经典的 LLaVA 架构，由一个 vision encoder，一个 projector 和一个大语言模型组成。

据官方介绍，这一代 POINTS 模型，不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想，同时极大了增强了模型的性能。

腾讯微信正式发布多模态大模型 POINTS 1.5

▲ OpenCompass Leaderboard 的情况

腾讯表示，POINTS1.5-7B 位居全球 10B 以下开源模型的榜首，超越诸如 Qwen2-VL, InternVL2 和 MiniCPM-V-2.5 等业界领先的模型。

实际应用方面，POINTS1.5 在复杂场景的 OCR，推理能力，关键信息提取，Latex 公式提取，数学，图片翻译，物体识别等几个方面中都有不错的表现。

参考资料：

Paper: https://huggingface.co/papers/2412.08443
Github: https://github.com/WePOINTS/WePOINTS
HuggingFace: https://huggingface.co/WePOINTS/POINTS-1-5-Qwen-2-5-7B-Chat

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

「21 世纪什么最贵？人才！」二十年前的黎叔语录，现在听来也不过时。这两年，大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发，期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本，并受到了研究员、工程师和投资人们的广泛关注与深刻讨论：为什么是 OpenAI？它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金，更重要的是一批顶尖 AI 研究人员的聚集。我们能看到，在 ChatGPT、Sora、GPT-4o 等划时代产品的背后，有一长串名单的核心贡献者，一家科技公司想要持续「伟大」，

6/21/2024 3:37:00 PM

机器之心

年度世界互联网科技大奖公布，腾讯Angel机器学习平台获领先科技奖

11月19日，2024年世界互联网大会领先科技奖在乌镇发布，腾讯Angel机器学习平台凭借其卓越的技术积累、创新的关键技术和广泛的应用场景，荣获本年度领先科技奖。腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。世界互联网大会领先科技奖由世界互联网大会主办，旨在奖励全球年度最具领先性的互联网科技成果，倡导互联网技术国际交流合作。

11/20/2024 11:13:00 AM

新闻助手

腾讯混元大模型核心论文曝光：Scaling law、MoE、合成数据以及更多

随着 ChatGPT 的横空出世，大语言模型能力开始在各项领域（传统 NLP、数学、代码等）得到广泛验证，目前已经深刻影响到腾讯混元团队日常生活的方方面面。腾讯混元团队长期致力于大语言模型的探索之路，大模型生产的各个环节开展研究创新以提升其基础能力，并将混元大模型的能力跟业务做深度结合，让生成式 AI 成为业务增长的放大器。大语言模型的设计、训练和优化是一项复杂的系统工程，涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。

11/22/2024 5:23:00 PM

新闻助手

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

腾讯微信正式发布多模态大模型 POINTS 1.5

相关资讯

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

年度世界互联网科技大奖公布，腾讯Angel机器学习平台获领先科技奖

腾讯混元大模型核心论文曝光：Scaling law、MoE、合成数据以及更多