cpu
-
一起聊一聊如何计算 Node.js GC 负载
在 Node.js 中,我们关注的比较的是 CPU 负载,但是在有 GC 的语言中,GC 负载也是需要关注的一个指标,因为 GC 过高会影响我们应用的性能。本文介绍关于 GC 负载…
-
CPU调频、线程绑核、优先级控制实践
0、背景 为了进一步优化App性能,最近针对如何提高应用对CPU的资源使用、以及在多线程环境下如何提高关键线程的执行优先级做了技术调研。本文是对技术调研过程的阶段性总结,将分别介绍…
-
使用Llama.cpp在CPU上快速的运行LLM
大型语言模型(llm)正变得越来越流行,但是它需要很多的资源,尤其时GPU。在这篇文章中,我们将介绍如何使用Python中的llama.cpp库在高性能的cpu上运行llm。 大型…
-
一起聊一聊如何计算 Node.js GC 负载
,在 Node.js 中,我们关注的比较的是 CPU 负载,但是在有 GC 的语言中,GC 负载也是需要关注的一个指标,因为 GC 过高会影响我们应用的性能。本文介绍关于 GC 负…
-
CPU调频、线程绑核、优先级控制实践
为了进一步优化App性能,最近针对如何提高应用对CPU的资源使用、以及在多线程环境下如何提高关键线程的执行优先级做了技术调研。本文是对技术调研过程的阶段性总结,将分别介绍普通应用如…
-
使用Llama.cpp在CPU上快速的运行LLM
大型语言模型(llm)正变得越来越流行,但是它需要很多的资源,尤其时GPU。在这篇文章中,我们将介绍如何使用Python中的llama.cpp库在高性能的cpu上运行llm。,,大…
-
javascript使用异步编程原因
,所谓异步,简单来说就是一个任务分为两段,先执行第一段,再执行其他任务。当第一段有执行结果时,回到第二段。,原因,1、JavaScript是单线程。,2、为了提高CPU的利用率。它…
-
一个时代有一个时代的计算架构
这是阿兰·图灵在1950年论文《计算机器和智能》中的经典提问,围绕着图灵的目标,软件和硬件开启了分头行动。,软件,以算法为核心,衍生出了神经网络,并在深度学习的加持下,让人工智能浪…
-
为什么说IO密集型业务,线程数是CPU数的2倍?
I/O密集型业务,线程数量要设置成 CPU 的 2 倍!,也不知道这是哪本书的坑爹理论,现在总有一些小青年老拿着这样的定理来说教。说的信誓旦旦,毋庸置疑,仿佛是权威的化身。讨论时把…
-
记一次 JMeter 压测 HTTPS 性能问题
在使用 JMeter 压测时,发现同一后端服务,在单机 500 并发下,HTTP 和 HTTPS 协议压测 RT 差距非常大。同时观测后端服务各监控指标水位都很低,因此怀疑性能瓶颈…
-
单核M1 CPU上实现FP32 1.5 TFlops算力?这是一份代码指南
首先,这是在电池供电的单核 MacBook Air 2020 上运行;,其次,这会以每条指令约 0.5 纳秒的延迟运行。,那些强大的加速器或 GPU 张量核不在我们的考虑范畴。我们…
-
Ceph OSD CPU 性能优化 之一
通常情况下,Ceph 的整体性能还是不错的,大量的场景优化为 Ceph 集群提供了可靠的性能保障。但是,很少有人知道 Ceph 当前并没有充分发挥出硬件的性能,也就说集群的性能与硬…