语言

一文解决所有「语言模型」疑问：能不能训多个epoch？怎么微调效率高？需要多少条数据？

过去几个月里，Meta的LLaMA引领了一场语言模型的开源狂潮，并且随着大众对语言模型训练研究的深入，很多问题也都有了答案。比如需要人类反馈和强化学习来对齐语言模型吗？语言模型在…

左手温暖右手
2023年7月17日 • 人工智能
000
大型语言模型综述全新出炉：从T5到GPT-4最全盘点，国内20余位研究者联合撰写

自 20 世纪 50 年代图灵测试提出以来，人们始终在探索机器处理语言智能的能力。语言本质上是一个错综复杂的人类表达系统，受到语法规则的约束。因此，开发能够理解和精通语言的强大 A…

即
2023年7月17日 • 人工智能
000
GPT模型中的数据中心型AI揭秘

译者 | 朱先忠审校 | 重楼图像来自文章https://arxiv.org/abs/2303.10158，由作者本人制作人工智能在改变我们的生活、工作和与技术互动的方…

0008
2023年7月17日 • 人工智能
000
通过一组单词构建视觉语言模型可能性研究

译者 | 朱先忠审校 | 重楼当前，多模式人工智能已经成为一个街谈巷议的热门话题。随着GPT-4的最近发布，我们看到了无数可能出现的新应用和未来技术，而这在六个月前是不可想…

qiekk
2023年7月17日 • 人工智能
000
人工智能

大型语言模型要避免的六个陷阱

从安全和隐私问题到错误信息和偏见，大型语言模型带来了风险和回报。最近人工智能(AI)取得了令人难以置信的进步，这主要是由于开发大型语言模型的进步。这些都是文本和代码生成工具的核心…

TKX
2023年7月17日
000
当我还在和ChatGPT聊天，有人已经开始用它来控制机器人干活了

你可曾想过用自己的话告诉机器人该做什么，就像对人说话那样？比如说，只要告诉你的家庭助理机器人「请帮我热一下午餐」，然后它就能自己找到微波炉。很神奇，对吗？尽管语言是人类表达意图…

星光璀璨
2023年7月17日 • 人工智能
000
GPT-3解数学题准确率升至92.5%！微软提出MathPrompter，无需微调即可打造「理科」语言模型

大型语言模型最为人诟病的缺点，除了一本正经地胡言乱语以外，估计就是「不会算数」了。比如一个需要多步推理的复杂数学问题，语言模型通常都无法给出正确答案，即便有「思维链」技术的加持，…

8871
2023年7月17日 • 人工智能
000
人工智能

关于GPT-4的应用需要了解什么

自从OpenAI公司发布大型语言模型GPT-4以来，人们都在尝试使用这一令人兴奋的应用程序。GPT-4可以将手绘的网站模型生成HTML代码。很多用户证明，它可以从信用卡交易中找到物…

0016
2023年7月17日
000
大脑分层预测让大模型更卷！

1000亿个神经元，每个神经元有8000个左右的突触，大脑的复杂结构为人工智能研究带来启发。当前，多数深度学习模型的架构，便是一种受生物大脑神经元启发的人工神经网络。生成式AI…

﹏ノ stop"
2023年7月17日 • 人工智能
000
最新RLHF拯救语言模型「胡说八道」！微调效果比ChatGPT更好，两名华人共同一作

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。 RLHF（基于人类反馈的强化学习）的一大缺点，终于被解决了！没错，虽然RLHF是大语言模型“核心技巧…

︶ㄣ东哥
2023年7月17日 • 人工智能
000
吵翻天！ChatGPT到底懂不懂语言？PNAS：先研究什么是「理解」吧

机器会不会思考这个问题就像问潜水艇会不会游泳一样。——Dijkstra 早在ChatGPT发布之前，业界就已经嗅到了大模型带来的变革。去年10月14日，圣塔菲研究所（Santa …

左手温暖右手
2023年7月17日 • 人工智能
000
人工智能

“AI教父”警告：开源大型语言模型可能会让AI变得更加危险

近几个月来，世界各地的AI实验室开发了多个大型语言模型开源大型语言模型可能带来的问题 OpenAI的GPT-4或谷歌的PaLM等大型语言模型为ChatGPT等生成式A…

Hou
2023年7月17日
000

3 / 8
1
2
3
4
5
6