语言
-
一文解决所有「语言模型」疑问:能不能训多个epoch?怎么微调效率高?需要多少条数据?
过去几个月里,Meta的LLaMA引领了一场语言模型的开源狂潮,并且随着大众对语言模型训练研究的深入,很多问题也都有了答案。 比如需要人类反馈和强化学习来对齐语言模型吗?语言模型在…
-
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。因此,开发能够理解和精通语言的强大 A…
-
GPT模型中的数据中心型AI揭秘
译者 | 朱先忠 审校 | 重楼 图像来自文章https://arxiv.org/abs/2303.10158,由作者本人制作 人工智能在改变我们的生活、工作和与技术互动的方…
-
通过一组单词构建视觉语言模型可能性研究
译者 | 朱先忠 审校 | 重楼 当前,多模式人工智能已经成为一个街谈巷议的热门话题。随着GPT-4的最近发布,我们看到了无数可能出现的新应用和未来技术,而这在六个月前是不可想…
-
大型语言模型要避免的六个陷阱
从安全和隐私问题到错误信息和偏见,大型语言模型带来了风险和回报。 最近人工智能(AI)取得了令人难以置信的进步,这主要是由于开发大型语言模型的进步。这些都是文本和代码生成工具的核心…
-
当我还在和ChatGPT聊天,有人已经开始用它来控制机器人干活了
你可曾想过用自己的话告诉机器人该做什么,就像对人说话那样? 比如说,只要告诉你的家庭助理机器人「请帮我热一下午餐」,然后它就能自己找到微波炉。很神奇,对吗? 尽管语言是人类表达意图…
-
GPT-3解数学题准确率升至92.5%!微软提出MathPrompter,无需微调即可打造「理科」语言模型
大型语言模型最为人诟病的缺点,除了一本正经地胡言乱语以外,估计就是「不会算数」了。 比如一个需要多步推理的复杂数学问题,语言模型通常都无法给出正确答案,即便有「思维链」技术的加持,…
-
关于GPT-4的应用需要了解什么
自从OpenAI公司发布大型语言模型GPT-4以来,人们都在尝试使用这一令人兴奋的应用程序。GPT-4可以将手绘的网站模型生成HTML代码。很多用户证明,它可以从信用卡交易中找到物…
-
大脑分层预测让大模型更卷!
1000亿个神经元,每个神经元有8000个左右的突触,大脑的复杂结构为人工智能研究带来启发。 当前,多数深度学习模型的架构,便是一种受生物大脑神经元启发的人工神经网络。 生成式AI…
-
最新RLHF拯救语言模型「胡说八道」!微调效果比ChatGPT更好,两名华人共同一作
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 RLHF(基于人类反馈的强化学习)的一大缺点,终于被解决了! 没错,虽然RLHF是大语言模型“核心技巧…
-
吵翻天!ChatGPT到底懂不懂语言?PNAS:先研究什么是「理解」吧
机器会不会思考这个问题就像问潜水艇会不会游泳一样。——Dijkstra 早在ChatGPT发布之前,业界就已经嗅到了大模型带来的变革。 去年10月14日,圣塔菲研究所(Santa …
-
“AI教父”警告:开源大型语言模型可能会让AI变得更加危险
近几个月来,世界各地的AI实验室开发了多个大型语言模型 开源大型语言模型可能带来的问题 OpenAI的GPT-4或谷歌的PaLM等大型语言模型为ChatGPT等生成式A…