模型

人工智能

训大模型讲究「化劲」！陶大程带队：一文打尽「高效训练」方案，别再说硬件是唯一瓶颈

深度学习领域已经取得了阶段性重大进展，特别是在计算机视觉、自然语言处理和语音等方面，使用大数据训练得到的大规模模型对于实际应用、提高工业生产力和促进社会发展具有巨大的前景。不过大…

yinjianhua
2023年7月17日
000
人工智能

微软官方亲自出教程，拿捏「Prompt工程」高级玩法

几个月来，ChatGPT、GPT-4 等大模型陆续发布。这些模型表现出了强大的涌现能力，但模型生成的结果是随机的，时好时坏，部分原因与 Prompt 的设计密切相关。很多人将 P…

唯一
2023年7月17日
000
人工智能

利用模型性能管理（MPM）解决机器学习模型监控挑战

译者 | 李睿审校 | 孙淑娟在过去几年，世界的数字化给组织和企业带来了独特的机遇和挑战。虽然数据的蓬勃发展为提高决策准确度提供了更多的机会，但现在分析和利用这些信息更加耗时…

世纪风行
2023年7月17日
000
人工智能

Meta开源的ChatGPT平替到底好不好用？测试结果、加料改装方法已出炉，2天5.2k星

ChatGPT 的持续爆火，早已让各大科技公司坐不住了。就在刚刚过去的一周，Meta「开源」了一个新的大模型系列 ——LLaMA（Large Language Mode…

sam
2023年7月17日
000
人工智能

拓尔思拓天大模型正式发布，推出媒体、金融、政务三大行业大模型

2023年6月29日，基于在NLP领域30年技术创新成果、10余年高质量数据和知识资产积累，以及在垂直行业10000多家企业级用户应用实践，拓尔思发布“拓天大模型”，并面向媒体、金…

维尼
2023年7月17日
000
人工智能

「模仿学习」只会套话？解释微调+130亿参数Orca：推理能力打平ChatGPT

自ChatGPT API开放后，大量的研究都选择利用ChatGPT和GPT-4等大型基础模型（LFM）的输出作为训练数据，然后通过模仿学习来提升小模型的能力。但由于模仿信号流于表…

99581
2023年7月17日
000
人工智能

OpenAI计划发布新的开源语言模型

5月16日消息，据The Information网站援引一位知情人士的话说，OpenAI正准备向公众发布一款新的开源语言模型，而之所以采取这一举措，是因为来自竞争对手的开源人工智能…

2962
2023年7月17日
000
人工智能

ChatGPT 新对手，阿里云大模型“通义千问”开始邀请测试

通义千问”开启企业邀请测试，并放出了测试官网。通义千问官网显示，通义千问是一个专门响应人类指令的大模型，是效率助手，也是点子生成机。阿里达摩院在 NLP 自然语言处理等前沿科研…

8005
2023年7月17日
000
人工智能

大语言模型的进化树，这是一份超详细ChatGPT「食用」指南

而在实际探索的过程中，实践者可能会苦于寻找适合自己应用的 AI 模型：是选择 LLM 还是微调模型？如果用 LLM，又该选择哪一种？近日，来自亚马逊、德州农工大学、莱斯大学等机构…

远方
2023年7月17日
000
人工智能

学习ChatGPT，AI绘画引入人类反馈会怎样？

最近，深度生成模型在根据文本 prompt 生成高质量图像方面取得了显著成功，部分原因在于深度生成模型扩展到了大规模网络数据集（如 LAION）。但是，一些重大挑战依然存在，因而大…

1457
2023年7月17日
000
人工智能

四年了，基础开源模型没有真正进步，指令调优大模型评估惊人发现

指令调优大语言模型的出现标志着 NLP 领域迎来一个重要转折点。从 ChatGPT 这类会话助手到解决复杂问题，这些指令调优大模型的变革能力在应用中瞩目。此类模型还包括 GPT-4…

Admin
2023年7月17日
000
人工智能

ChatGPT模型参数≠1750亿，有人用反证法进行了证明

ChatGPT 的火热持续到了今天，围绕它的爆点新闻和技术解读不断涌现。关于其参数量，有一种普遍的假设认为，ChatGPT 的参数量与 GPT-3 论文中介绍的 1750 亿参数模…

8961
2023年7月17日
000

21 / 45
18
19
20
21
22
23
24