模型
-
训大模型讲究「化劲」!陶大程带队:一文打尽「高效训练」方案,别再说硬件是唯一瓶颈
深度学习领域已经取得了阶段性重大进展,特别是在计算机视觉、自然语言处理和语音等方面,使用大数据训练得到的大规模模型对于实际应用、提高工业生产力和促进社会发展具有巨大的前景。 不过大…
-
微软官方亲自出教程,拿捏「Prompt工程」高级玩法
几个月来,ChatGPT、GPT-4 等大模型陆续发布。这些模型表现出了强大的涌现能力,但模型生成的结果是随机的,时好时坏,部分原因与 Prompt 的设计密切相关。 很多人将 P…
-
利用模型性能管理(MPM)解决机器学习模型监控挑战
译者 | 李睿 审校 | 孙淑娟 在过去几年,世界的数字化给组织和企业带来了独特的机遇和挑战。虽然数据的蓬勃发展为提高决策准确度提供了更多的机会,但现在分析和利用这些信息更加耗时…
-
Meta开源的ChatGPT平替到底好不好用?测试结果、加料改装方法已出炉,2天5.2k星
ChatGPT 的持续爆火,早已让各大科技公司坐不住了。 就在刚刚过去的一周,Meta「开源」了一个新的大模型系列 ——LLaMA(Large Language Mode…
-
拓尔思拓天大模型正式发布,推出媒体、金融、政务三大行业大模型
2023年6月29日,基于在NLP领域30年技术创新成果、10余年高质量数据和知识资产积累,以及在垂直行业10000多家企业级用户应用实践,拓尔思发布“拓天大模型”,并面向媒体、金…
-
「模仿学习」只会套话?解释微调+130亿参数Orca:推理能力打平ChatGPT
自ChatGPT API开放后,大量的研究都选择利用ChatGPT和GPT-4等大型基础模型(LFM)的输出作为训练数据,然后通过模仿学习来提升小模型的能力。 但由于模仿信号流于表…
-
OpenAI计划发布新的开源语言模型
5月16日消息,据The Information网站援引一位知情人士的话说,OpenAI正准备向公众发布一款新的开源语言模型,而之所以采取这一举措,是因为来自竞争对手的开源人工智能…
-
ChatGPT 新对手,阿里云大模型“通义千问”开始邀请测试
通义千问”开启企业邀请测试,并放出了测试官网。 通义千问官网显示,通义千问是一个专门响应人类指令的大模型,是效率助手,也是点子生成机。 阿里达摩院在 NLP 自然语言处理等前沿科研…
-
大语言模型的进化树,这是一份超详细ChatGPT「食用」指南
而在实际探索的过程中,实践者可能会苦于寻找适合自己应用的 AI 模型:是选择 LLM 还是微调模型?如果用 LLM,又该选择哪一种? 近日,来自亚马逊、德州农工大学、莱斯大学等机构…
-
学习ChatGPT,AI绘画引入人类反馈会怎样?
最近,深度生成模型在根据文本 prompt 生成高质量图像方面取得了显著成功,部分原因在于深度生成模型扩展到了大规模网络数据集(如 LAION)。但是,一些重大挑战依然存在,因而大…
-
四年了,基础开源模型没有真正进步,指令调优大模型评估惊人发现
指令调优大语言模型的出现标志着 NLP 领域迎来一个重要转折点。从 ChatGPT 这类会话助手到解决复杂问题,这些指令调优大模型的变革能力在应用中瞩目。此类模型还包括 GPT-4…
-
ChatGPT模型参数≠1750亿,有人用反证法进行了证明
ChatGPT 的火热持续到了今天,围绕它的爆点新闻和技术解读不断涌现。关于其参数量,有一种普遍的假设认为,ChatGPT 的参数量与 GPT-3 论文中介绍的 1750 亿参数模…