模型
-
训练深度学习神经网络的常用五个损失函数
神经网络在训练时的优化首先是对模型的当前状态进行误差估计,然后为了减少下一次评估的误差,需要使用一个能够表示错误函数对权重进行更新,这个函数被称为损失函数。 损失函数的选择与神经网…
-
无缝支持Hugging Face社区,Colossal-AI低成本轻松加速大模型
大模型已成为 AI 圈的一种潮流,不仅横扫各大性能榜单,更产生了诸多有趣应用。例如,微软和 OpenAI 开发的自动代码建议补全神器 Copilot,化身程序员最佳助手,提升工作…
-
Pytorch创建多任务学习模型
MTL最著名的例子可能是特斯拉的自动驾驶系统。在自动驾驶中需要同时处理大量任务,如物体检测、深度估计、3D重建、视频分析、跟踪等,你可能认为需要10个以上的深度学习模型,但事实并非…
-
资源受限如何提高模型效率?一文梳理NLP高效方法
训练越来越大的深度学习模型已经成为过去十年的一个新兴趋势。如下图所示,模型参数量的不断增加让神经网络的性能越来越好,也产生了一些新的研究方向,但模型的问题也越来越多。 首先,这类模…
-
机器学习中必学的四种交叉验证技术
介绍 考虑在数据集上创建模型,但它在看不见的数据上失败。我们不能简单地将模型拟合到我们的训练数据中,然后坐等它在真实的、看不见的数据上完美运行。 这是一个过度拟合的例子,我们的模…
-
如何将一个算法模型转换成端智能模型?
在开始端智能技术工程实践的介绍前,有一个无法绕过的问题:端上的计算能力到底如何?虽然我们对神经网络运算加速有所耳闻,也知道不同的移动设备有着不同的加速方案,但没有一个定量的分析很难…
-
如何高效、精准地进行图片搜索?看看轻量化视觉预训练模型
你是否有过图像检索的烦恼? 或是难以在海量化的图像中准确地找到所需图像,或是在基于文本的检索中得到差强人意的结果。对于这个难题,微软亚洲研究院和微软云计算与人工智能事业部的研究人…
-
效率提升1200倍!麻省理工开发AI制药新模型
据外媒Tech Xplore报道,麻省理工学院的研究人员最近开发了一种叫做EquBind的新模型,这个模型可以提前预测新蛋白质分子的结构,提升药物开发的效率。 目前这项技术已经得到…
-
机器学习模型的集成方法总结:Bagging, Boosting, Stacking, Voting, Blending
机器学习是人工智能的一个分支领域,致力于构建自动学习和自适应的系统,它利用统计模型来可视化、分析和预测数据。一个通用的机器学习模型包括一个数据集(用于训练模型)和一个算法(从数据学…
-
专为决策树打造,新加坡国立大学&清华大学联合提出快速安全的联邦学习新系统
联邦学习是机器学习中一个非常火热的领域,指多方在不传递数据的情况下共同训练模型。随着联邦学习的发展,联邦学习系统也层出不穷,例如 FATE, FedML, PaddleFL, Te…
-
扩散模型背后数学太难了,啃不动?谷歌用统一视角讲明白了
最近一段时间,AI 作画可谓是火的一塌糊涂。 在你惊叹 AI 绘画能力的同时,可能还不知道的是,扩散模型在其中起了大作用。就拿热门模型 OpenAI 的 DALL·E 2 来说,只…
-
大模型训练之难,难于上青天?预训练易用、效率超群的「李白」模型库来了!
LiBai(李白)模型库覆盖了 Hugging Face、Megatron-LM、DeepSpeed、FairSeq 这些所有主流 Transformer 库的优点,让大模型训练飞…