标签: Quantization

5 篇文章

在本地跑大模型正在变现实：GLM-5.2 与消费级 AI 算力革命

分析 GLM-5.2 本地部署实践背后的硬件需求与模型量化趋势，以及个人 AI 计算能力的演进。

2026年6月23日

LLM LocalAI Quantization

本地大模型真的成熟了吗？从“能跑”到“好用”的鸿沟

围绕本地大模型在性能、量化损失、算力与体验之间的矛盾，讨论“可运行”与“真正可用”之间的现实差距。

2026年6月17日

LLM AI-Infrastructure Quantization

Gemma 4 QAT 模型：移动端 AI 推理的轻量化革新

介绍 Gemma 4 的量化感知训练及其在手机和笔记本本地推理中的性能提升与能耗优化。

2026年6月6日

Quantization AI Mobile Computing

Gemma 4 12B：无需编码器的多模态 AI 本地化实践

探索 Google 最新 Gemma 4 12B 模型如何在无需传统编码器的情况下，实现本地多模态推理与代码生成。

2026年6月4日

AI Multimodal LocalDeployment

Gemma 4 12B：无需编码器的多模态 AI 革命

探讨 Google 最新 Gemma 4 12B 模型如何在不依赖传统编码器的情况下，实现多模态处理与本地部署的可能性。

2026年6月4日

AI Multimodal MachineLearning

← 查看所有标签