<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>量化 on 凱凱的技術筆記</title><link>https://kaikai365.com/tags/%E9%87%8F%E5%8C%96/</link><description>Recent content in 量化 on 凱凱的技術筆記</description><generator>Hugo</generator><language>zh-TW</language><lastBuildDate>Mon, 08 Jun 2026 14:30:00 +0800</lastBuildDate><atom:link href="https://kaikai365.com/tags/%E9%87%8F%E5%8C%96/index.xml" rel="self" type="application/rss+xml"/><item><title>GGUF 量化實戰：在 Raspberry Pi 上跑 Qwen3 7B 的完整流程</title><link>https://kaikai365.com/posts/2026-06-08-gguf-quantization-raspberry-pi-qwen3-7b/</link><pubDate>Mon, 08 Jun 2026 14:30:00 +0800</pubDate><guid>https://kaikai365.com/posts/2026-06-08-gguf-quantization-raspberry-pi-qwen3-7b/</guid><description>&lt;h2 id="前言把-ai-塞進信用卡大小的電腦">前言：把 AI 塞進信用卡大小的電腦&lt;/h2>
&lt;p>你大概聽過「大語言模型要跑在顯卡上」，但你有沒有想過，一台只要 35 美元的 Raspberry Pi 也能跑 70 億參數的 Qwen3？&lt;/p>
&lt;p>這聽起來像魔法，但背後的技術其實很樸實——&lt;strong>GGUF 量化&lt;/strong>（GPT-Generated Unified Format）。它把原本需要 16 GB 記憶體的模型壓縮到 4 GB，還不需要任何獨顯，純粹用 CPU 就能跑。&lt;/p>
&lt;p>這篇文章會帶你走完整流程：從模型下載、量化選擇、到在 Raspberry Pi 上實際跑起來。無論你是硬體玩家、邊緣運算愛好者，還是單純想省錢跑 AI 的窮人，這篇都適合你。&lt;/p>
&lt;div class="adsense-container" style="margin: 20px 0; text-align: center;">
&lt;span style="font-size: 12px; color: #888; display: block; margin-bottom: 5px;">- 廣告 -&lt;/span>
&lt;ins class="adsbygoogle"
style="display:block; text-align:center;"
data-ad-layout="in-article"
data-ad-format="fluid"
data-ad-client="ca-pub-7490556205068980"
data-ad-slot="YYYYYYYYYY">&lt;/ins>
&lt;script>
(adsbygoogle = window.adsbygoogle || []).push({});
&lt;/script>
&lt;/div>
&lt;h2 id="什麼是-gguf為什麼它能讓你省記憶體">什麼是 GGUF？為什麼它能讓你省記憶體？&lt;/h2>
&lt;p>GGUF 是 &lt;a href="https://github.com/ggml-org/llama.cpp">llama.cpp&lt;/a> 專案開發的模型格式。它的核心思想很直接：&lt;strong>把模型的權重用更少的 bit 來表示&lt;/strong>。&lt;/p>
&lt;p>一般 PyTorch 模型用的是 FP16（16 位元浮點數），一個參數佔 2 bytes。但如果你把精度降到 4 bit（也就是 0.5 bytes），模型檔案就能縮小到原來的四分之一。&lt;/p></description></item></channel></rss>