<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>樹莓派 on 凱凱的技術筆記</title><link>https://kaikai365.com/tags/%E6%A8%B9%E8%8E%93%E6%B4%BE/</link><description>Recent content in 樹莓派 on 凱凱的技術筆記</description><generator>Hugo</generator><language>zh-TW</language><lastBuildDate>Tue, 09 Jun 2026 14:30:00 +0800</lastBuildDate><atom:link href="https://kaikai365.com/tags/%E6%A8%B9%E8%8E%93%E6%B4%BE/index.xml" rel="self" type="application/rss+xml"/><item><title>Qwen3-0.6B 本地部署教學：在樹莓派上跑大型語言模型</title><link>https://kaikai365.com/posts/2026-06-09-qwen3-0-6b-raspberry-pi-deployment/</link><pubDate>Tue, 09 Jun 2026 14:30:00 +0800</pubDate><guid>https://kaikai365.com/posts/2026-06-09-qwen3-0-6b-raspberry-pi-deployment/</guid><description>&lt;h2 id="前言">前言&lt;/h2>
&lt;p>你以為跑大型語言模型（LLM）一定要有一張 expensive 的顯卡、一台配備頂級 CPU 的伺服器嗎？錯了。&lt;/p>
&lt;p>阿里巴巴的 Qwen3 系列在 2025 年 4 月發表時，最引人注目的不是那個 235B 參數的 MoE 旗艦模型，而是那個只有 &lt;strong>0.6B（6 億）參數&lt;/strong> 的迷你版本——Qwen3-0.6B。它體積小到什麼程度？量化後只有約 523 MB，連你的手機都能裝。&lt;/p>
&lt;p>而這篇文章要帶你用一台樹莓派（Raspberry Pi），在本地跑起這個「麻雀雖小，五臟俱全」的語言模型。不需要雲端、不需要網路、隱私全在自己手上。&lt;/p>
&lt;div class="adsense-container" style="margin: 20px 0; text-align: center;">
&lt;span style="font-size: 12px; color: #888; display: block; margin-bottom: 5px;">- 廣告 -&lt;/span>
&lt;ins class="adsbygoogle"
style="display:block; text-align:center;"
data-ad-layout="in-article"
data-ad-format="fluid"
data-ad-client="ca-pub-7490556205068980"
data-ad-slot="YYYYYYYYYY">&lt;/ins>
&lt;script>
(adsbygoogle = window.adsbygoogle || []).push({});
&lt;/script>
&lt;/div>
&lt;h2 id="什麼是-qwen3-06b">什麼是 Qwen3-0.6B？&lt;/h2>
&lt;p>Qwen3-0.6B 是 Qwen3 系列中最輕量的稠密（Dense）模型，於 2025 年 4 月 29 日由阿里巴巴 Qwen 團隊發布，採用 &lt;strong>Apache 2.0 授權&lt;/strong>，可自由商用。&lt;/p>
&lt;h3 id="核心規格">核心規格&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>項目&lt;/th>
&lt;th>規格&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>參數數量&lt;/td>
&lt;td>0.6B（0.44B 非嵌入層）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Transformer 層數&lt;/td>
&lt;td>28 層&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>注意力機制&lt;/td>
&lt;td>GQA（16 個 Query heads / 8 個 KV heads）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>上下文長度&lt;/td>
&lt;td>32,768 tokens&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>詞彙表大小&lt;/td>
&lt;td>151,669 tokens&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>訓練語料&lt;/td>
&lt;td>約 36 兆 tokens（119 種語言）&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>授權&lt;/td>
&lt;td>Apache 2.0&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h3 id="為什麼-06b-值得關注">為什麼 0.6B 值得關注？&lt;/h3>
&lt;p>別看它參數少，Qwen3-0.6B 經歷了從大模型（Qwen3-32B 和 Qwen3-235B-A22B）到小模型的&lt;strong>知識蒸餾&lt;/strong>過程，继承了思考模式切換和推理能力。&lt;/p></description></item></channel></rss>