模型
在模型中植入不可检测后门,「外包」AI更易中招
机器学习(ML)正在迎来一个新的时代。
还在为玩不了ChatGPT苦恼?这十几个开源平替也能体验智能对话
本文将为大家盘点一下 ChatGPT 的开源平替项目。
腾讯获国际信息检索领域国际权威比赛两项冠军,展示AI大模型技术实力
近日,信息检索领域国际顶级学术会议WSDM(Web Search and Data Mining)宣布了WSDM CUP 2023竞赛成绩,来自腾讯的研究团队基于大模型预训练、搜索排序以及集成学习等技术上的突破,在无偏排序学习和互联网搜索预训练模型赛道上的两项任务中获得冠军,体现了在该领域的领先技术实力。ACM WSDM(Web Search and Data Mining) 会议是信息检索领域顶级会议之一,由SIGIR、SIGKDD、SIGMOD和SIGWEB四个专委会协调筹办,在互联网搜索、数据挖掘领域享有较高
充电续航 | ChatGPT和大模型春季课程报名啦!
导读RLChina 邀请了全球相关领域知名专家和学者举办 ChatGPT和大模型春季课程,深入讲解ChatGPT和大模型的原理和实践,从不同的角度探讨“ChatGPT以后的通用人工智能理论和应用”。课程为期一周,分为实践课、专题报告和话题讨论三个部分,希望能给更广泛的爱好者带来帮助。点击文末链接即可访问 RLChina 强化学习社区。课程安排主 题ChatGPT 和大模型春季课程时 间2023 年 3 月 13 日至 17 日 19:00-21:00讲 师来自全球顶尖高校和企业的专家授 课 形 式开放的免费网络直播
ChatGPT的前世今生:OpenAI的技术「执拗」与「豪赌」
本文全方位地介绍了 ChatGPT 的能力特征、发展历程以及 OpenAI 一路走来所坚守的技术路线,并对 ChatGPT 出现之后 NLP 领域的范式转换进行了展望,即 ChatGPT 开启「文本生成 + 指令」的范式。
ChatGPT真的是「通才」吗?杨笛一等人给它来了个摸底考试
ChatGPT 真的是「通才」吗?单拎出哪项能力都能完胜其他模型吗?哪些任务是 ChatGPT 擅长的,哪些不是?为了系统地探索这些问题,南洋理工大学博士生 Chengwei Qin、斯坦福大学计算机科学助理教授杨笛一等人进行了大量实验。
ChatGPT又添劲敌?OpenAI核心员工创业,新模型获一片叫好
ChatGPT 给 AI 领域带来的变革,可能正在催生一个新产业。上周末,有消息称 AI 初创公司 Anthropic 即将获得大约 3 亿美元的新融资。Anthropic 由 OpenAI 前研究副总裁 Dario Amodei、GPT-3 论文一作 Tom Brown 等人在 2021 年共同创立,目前已筹集了超过 7 亿美元的资金,最新一轮的估值达到了 50 亿美元。他们开发了一种对标老东家知名产品 ChatGPT 的人工智能系统,其似乎在关键方面对原版系统做了优化改进。Anthropic 提出的系统名叫 C
特斯拉前AI总监教你手搓GPT大模型,教学视频已出
「从零开始,用代码直接写。」
我用ChatGPT写神经网络:一字不改,结果竟然很好用
AI 写 AI,来得比预料中更快一些。
AIGC用于智能写作的技术综述-达观数据
详细介绍AIGC用于智能写作的相关技术和达观数据的智能写作产品实践
ChatGPT背后的开源AI框架Ray,现在值10亿美元
最近一段时间,文本生成的人工智能在互联网上掀起了一阵风暴:ChatGPT 因为可以对人们能想到的几乎任何问题提供非常详细、近乎逼真的回答而受到追捧。大模型应用的出现让人们对于 AI 技术突破充满了信心,不过很少有人知道在其背后,一个分布式机器学习框架正为这场生成式 AI 革命提供动力。
写在Stack Overflow封禁ChatGPT之后,人工智能的危机时刻
在人工智能领域,不可思议的事情正在悄然发生,有好有坏。每个人都在谈论 chatGPT (OpenAI)、Dall-E 2 和 Lensa 这样的系统,它们生成的文本和图像看起来既自然又不费力。
如何向大模型注入知识?达摩院通义对话模型SPACE系列探索
如何将人类先验知识低成本融入到预训练模型中一直是个难题。达摩院对话智能团队提出了一种基于半监督预训练的新训练方式,将对话领域的少量有标数据和海量无标数据一起进行预训练,从而把标注数据中蕴含的知识注入到预训练模型中去,打造了 SPACE 1/2/3 系列模型。SPACE-1:注入对话策略知识,AAAI 2022 长文录用;SPACE-2:注入对话理解知识,COLING 2022 长文录用,并获 best paper award 推荐;SPACE-3:集对话理解 对话策略 对话生成于一体的模型, SIGIR 2
Creator 面对面 | 大规模预训练模型的新思考:效率和泛化
自 2018 年谷歌推出 BERT(3.4 亿参数)以来,语言模型开始朝着「大」演进。国内外先后出现了参数量高达千亿甚至万亿的语言模型,比如谷歌的 T5(110 亿)、OpnAI 的 GPT-3(1,750 亿)、华为联合鹏城实验室的盘古(Pangu)(2000 亿),智源研究院的 WuDao2.0(1.75 万亿)……
对于这样的大模型,其背后支撑的是巨额的算力要求。那么对于 AI 民主化,降低模型训练门槛和壁垒,同时兼顾性能和表现,在未来模型的训练上又会有怎样的思考呢?
关键点检测项目代码开源了!
作者:闫永强,算法工程师,Datawhale成员 本文通过自建手势数据集,利用YOLOv5s检测,然后通过开源数据集训练squeezenet进行手部关键点预测,最后通过指间的夹角算法来判断具体的手势,并显示出来。文章第四部分为用C 实现整体的ncnn推理(代码较长,可先马后看)一、YOLOV5训练手部检测训练及部署思路类似表情识别,需要将handpose数据集标签改成一类,只检测手部,简化流程,更易上手。此部分数据集来源格物钛 ,具体的效果如图:本教程所用训练环境:系统环境:Ubuntu16.04cuda版本:
阿里开源 支持10万亿模型的自研分布式训练框架EPL(Easy Parallel Library)
最近阿里云机器学习PAI平台和达摩院智能计算实验室一起发布“低碳版”巨模型M6-10T,模型参数已经从万亿跃迁到10万亿,规模远超业界此前发布的万亿级模型,成为当前全球最大的AI预训练模型。
站在2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?
岁末年初之际,让我们回顾大模型的过去,展望大模型的未来。
图神经网络准确预测无机化合物性质,加速固态电池的设计
编辑/绿萝大规模从头计算与结构预测的进步相结合,在无机功能材料的发现中发挥了重要作用。目前,在无机材料的广阔化学空间中,只发现了一小部分。实验和计算研究人员都需要加速探索未知的化学空间。来自美国国家可再生能源实验室(NREL)、科罗拉多矿业学院和伊利诺伊大学的研究人员展示了一种可以准确预测无机化合物性质的机器学习方法。展示了基态(GS)和更高能量结构的平衡训练数据集,对使用通用图神经网络(GNN)架构准确预测总能量的重要性。该研究可加速固态电池的设计。该研究以「Predicting energy and stabi