测试
-
Intel 12代酷睿搭配win11系统性能更佳 比win10出色
根据此前的测试来看,intel12代酷睿处理器在使用win11系统的时候要比win10系统性能更加强大,不过测试平台较为局限,因此最近有linux用户也进行了一些测试,并得出了类似…
-
达摩院发布大模型测试基准:GPT-4勉强及格,其他模型悉数落败
随着大模型的发展,尤其是近来各种开源大模型的发布,如何对各种模型进行充分并且准确的评估变得越来越重要。其中一个越来越受到认可的方向就是利用人类考题来检验模型,从而可以测试模型的知识…
-
11分钟训完GPT-3!英伟达H100 横扫MLPerf 8项基准测试,下一代显卡25年发布
最新MLPerf训练基准测试中,H100 GPU在所有的八项测试中都创下了新纪录! 如今,NVIDIA H100几乎已经统治了所有类别,并且是新LLM基准测试中使用的唯一 的GPU…
-
一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型
一个「终极丐版」的「图灵测试」,让所有大语言模型都难住了。 人类却可以毫不费力地通过测试。 大写字母测试 研究人员用了一个非常简单的办法。 把真正的问题混到一些杂乱无章的大写字母写…
-
DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
6 月 21 日消息,据彭博社报道,谷歌人工智能研究实验室 DeepMind 的联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)在他的新书中提出了一种新的测试人工智能…
-
AI测试的迷思
近年来,我一直关注AI相关的测试,并积极参与多个全国性测试社区和社群。在这些社区中,我与不同公司和领域的测试专家交流探讨AI测试相关话题,包括业界顶尖公司的专家和国内知名测试学者。…
-
2023年的网络分区:人工智能和自动化如何改变事物
网络分区是一种基本的预防性安全控制,可减少企业的攻击面并阻止横向移动。它使攻击者的生活更具挑战性,因为他们无法从互联网直接访问所有虚拟机(vm)。 而且,即使他们进入了企业网络,如…
-
一文详解智能汽车激光雷达技术
激光雷达在自动驾驶应用中主要用来探测道路上的障碍物信息,把数据和信号传递给自动驾驶的大脑,再做出相应的驾驶动作,但室外常见的干扰因素如雨、雾、雪、粉尘、高低温等对激光雷达的识别造成…
-
DeepMind创始人要推翻图灵测试!外国小哥用AI 90天狂赚3万美元
图灵测试过时了? DeepMind创始人Mustafa Suleyman提出了这个振聋发聩的新观点。 他在新书中提出了一个全新的「图灵测试」,给AI 10万美元的启动资金,让它通过…
-
GPT-4创造力竟全面碾压人类!最新创造力测试GPT4排名前1%
最近,一项有关GPT-4的创造力思维测试火了。 来自蒙大拿大学和UM Western大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在了前1…
-
GPT-4“自我反思”后能力大增,测试表现提升 30%
4 月 4 日消息,OpenAI 最新的语言模型 GPT-4 不仅能够像人类一样生成各种文本,还能够设计和执行测试来评估和改进自己的表现。这种“反思”技术让 GPT-4…
-
Batch Norm层等暴露TTA短板,开放环境下解决方案来了
测试时自适应(Test-Time Adaptation, TTA)方法在测试阶段指导模型进行快速无监督 / 自监督学习,是当前用于提升深度模型分布外泛化能力的一种强有效工具。然而在…