CHEGVA

让我们面对现实 让我们忠于理想

  • 😺 关于我
  • 👧 我的崽崽
  • ✪ 切·格瓦拉与自由精神
  • 🌈 每日诗文
  • 📣 说说动态
  • ☕ 博客时光
  • 🤖 站点地图
  • 📸 照片墙
  • 🎶 音乐墙
  • 🎮 轻松一下
  • 💌 给我留言

⛳ 公众号

带头学习公众号

✈ 找一找

☰ 分类目录

  • AI世界 (14)
  • linux相关 (28)
  • 操作系统 (37)
  • 常用工具 (65)
  • 存储技术 (28)
  • 网络技术 (54)
  • DNS与IPv6实战 (12)
  • 数据库中间件大数据 (45)
  • 编程学习 (31)
  • Shell编程 (54)
  • Python开发 (146)
  • Go语言学习 (16)
  • Java学习 (20)
  • Web前端 (40)
  • HTTP与WEB服务 (30)
  • SaltStack实战 (8)
  • 虚拟化与云计算 (11)
  • OpenStack实战 (19)
  • Docker容器技术 (28)
  • Kubernetes & 云原生 (37)
  • 持续集成交付(CI/CD) (33)
  • 日志服务实战 (16)
  • Zabbix监控体系 (19)
  • SRE运维体系 (21)
  • 软件测试 (8)
  • 安全防护 (24)
  • 性能优化及排错 (37)
  • 高效工作 (58)
  • 个人随笔 (50)
  • 人生感悟 (26)
  • 我的崽崽 (33)
  • 志合的诗 (46)
  • 儒释道禅 (43)
  • 大哉周易 (38)
  • 天命无算 (12)
  • 历史科学趣闻 (32)
  • 读书笔记 (37)
  • 电影动漫 (61)
  • 诗歌分享 (43)
  • 美文分享 (46)
  • 资源分享 (32)
  • 游戏分享 (30)
  • 公益讲座 (11)

✎ 近期文章

  • 大模型推理资源需求计算及使用场景示例
  • 大模型GPU显存算力需求计算
  • 《盐铁论》全文
  • nvidia-smi工具详解及使用示例
  • Kubernetes PV数据卷缩容方案及统计PV容量
  • 易经六十四卦Unicode符号表
  • 从0开始学微服务
  • 用通俗的方式介绍大语言模型训练过程
  • JMeter混合场景压测
  • K8s HPA原理及最佳实践

♚ 大家正在看

  • 李白诗歌精选100首 - 426 views
  • 六十甲子纳音五行命运特征汇总 - 308 views
  • 赤马红羊劫 - 284 views
  • 英伟达GPU参数速查表 - 268 views
  • 中国历史朝代时间轴图表 - 227 views
  • 《论持久战》(全文) - 218 views
  • 大模型GPU显存算力需求计算 - 203 views
  • 龙树菩萨《中论》 - 181 views
  • 达摩禅师全集(悟性论、血脉论、破相论、四行观) - 168 views
  • 《哈耶克作品集:通往奴役之路/自由宪章/致命的自负》全套六册 - 168 views
  • 《盐铁论》全文 - 165 views
  • 金庸武侠年表,终于把每部人物关系串起来了 - 161 views

⛅ 标签云

DNS实战 Docker ELKStack Git GlusterFS Jenkins KVM Linux相关 oracle Python SaltStack Web服务 zabbix ZFS 一起旅行 云计算 人生感悟 传统文化 佛家 儒家 儒释道禅 切·格瓦拉 国学 存储技术 志合的诗 性能优化及排错 持续集成 操作系统 数据库 日记 易经 服务部署 生活琐事 监控架构 禅宗 系统架构 网络 虚拟化 诗歌 读书 资源分享 软件测试 运维架构 道家 高效工作

☘ 随机文章

  • Linux文件系统缓存及命中率状态查看
  • 学习、做人的原则
  • Prometheus快速入门及进阶
  • Python3上云前置工作检测脚本
  • Python进阶(1)–浅拷贝与深拷贝
  • JVM初探
  • Zabbix生产案例实战二——Zabbix监控Java应用
  • 我的崽崽(22)
  • centos、ubuntu、epel、pypi更换下载源为阿里源
  • HTTPie 官方文档中文翻译版

⌚ 博客历程

博客历程:2016年5月20日(成立)
     2016年6月(接入CDN)
     2016年7月(添加音乐墙)
     2017年4月(添加说说动态)
     2017年5月(AWS迁移至国内)
     2017年12月(添加博客时光)
     2018年6月(添加轻松一下)
     2019年8月(添加我的崽崽)
     2020年6月(添加每日诗文)
     2021年9月(添加站点地图)

网站运行:3580 天
目前共计: 1466 篇日志 966.1w 字
浏览 757.5w 次,继续努力☕

☺ 近期评论

  • 正在加载...

♡ 友情链接

  • 国学学习软件下载网
  • 酷壳
  • 德明健身
  • 我的github
  • 中国历史地图
  • 古诗文网
  • 汉典
  • 国学大师
  • 劝学网
  • 安祥禅

大模型推理资源需求计算及使用场景示例

2026年3月10日 by anzhihe·0评论 · 29 人阅读

上一篇我们了解了 大模型GPU显存算力需求计算,这次我们把CPU和内存的需求也一起纳入考量。在异构计算(CPU+GPU协同)和纯CPU推理日益普及的今天,了解这三者的需求对于在不同硬件上部署...

Continue reading >>

大模型GPU显存算力需求计算

2026年3月3日 by anzhihe·0评论 · 631 人阅读

一、显存占用核心组成部分

大语言模型在GPU上运行时的显存占用主要包括以下几个部分:

1. 模型参数

在模型推理时首先需要存储模型本身的参数,其占用的显存计算公式为:参数量 x 参数精度。常用的参...

Continue reading >>

《盐铁论》全文

2026年2月25日 by anzhihe·0评论 · 907 人阅读
《盐铁论》全文,《盐铁论》简介,《盐铁论》全文在线阅读...Continue reading >>

nvidia-smi工具详解及使用示例

2026年2月11日 by anzhihe·0评论 · 873 人阅读

nvidia-smi(NVIDIA System Management Interface)是NVIDIA官方提供的GPU管理工具,提供管理和监控 GPU 的接口。其核心功能包括NVIDIA GPU运...

Continue reading >>

Kubernetes PV数据卷缩容方案及统计PV容量

2026年2月6日 by anzhihe·0评论 · 673 人阅读

在 Kubernetes 中,直接对 Persistent Volume (PV) 进行容量缩容(减小容量)通常是不被支持的。这主要是出于数据安全的考虑,因为贸然缩小底层存储设备可能会破坏数据。

理解...

Continue reading >>

易经六十四卦Unicode符号表

2026年1月30日 by anzhihe·0评论 · 991 人阅读

Yijing Hexagram Symbols

U+4DC0 – U+4DFF   (19904–19967)

Character
(decimal)DecimalCharacter
(hex)He...Continue reading >>

文章导航

1 2 … 245
© 2016-2026 安志合 版权所有 | 订阅  | 站点地图 | 站点统计 | 京ICP备17028760号-1 | 由WordPress自豪地提供. Theme: Flat by Themeisle.