Posts

OpenConnector 讓 AI Agent 一次連線、 everywhere 使用

前陣子幫團隊搭一個內嵌式 AI Agent，最頭痛的不是模型選型或 prompt engineering，而是「Agent 要怎麼連使用者的 Gmail、GitHub、Notion」。傳統做法是讓使用者在 App 裡填 API Key，或者走一輪 OAuth2 流程，把 token 存在自己的資料庫。每加一個服務提供者，就要多寫一套認證邏輯、token 重新整理機制、許可權管理。做三個服務還勉強撐得住，做到十個以上就是維護噩夢。 OpenConnector 解決的就是這個問題。它是一套開源的「聯結器閘道」，定位跟 Composio 類似，但走的路線不太一樣——憑證、許可權範圍、執行記錄全都留在閘道層，Agent 只拿到中繼資料和結果，不用碰金鑰。它到底在做什麼 OpenConnector 讓你「連一次帳號，就能讓 Agent 隨處使用」。你部署一臺 OpenConnector Gateway（跑在本機 Docker、Fly.io、Cloudflare Workers，或者直接上 OOMOL SaaS），然後在儀錶板裡把 Gmail、GitHub、Slack 這些服務一一連線。之後你的 Agent 透過 SDK、CLI、MCP 或 HTTP API 呼叫 Action，閘道自動處理憑證注入、token 重新整理、許可權檢查，最後回傳結果。 Agent 永遠不知道 OAuth token 長什麼樣子。金鑰只存在閘道內。 Agent 和使用者應用程式之間多了一層「憑證邊界」。這在 SaaS 產品裡特別好用——不用把每個使用者的 API Key 存在自己的資料庫，也不用擔心 token 過期時 Agent 卡住。閘道自動處理 refresh token、重新授權。部署選項 OpenConnector 有四條路可以走。最輕量的是跑在本機 Docker 上。docker compose up 一行指令就起來了，儀錶板在 localhost:3000，MCP endpoint 也在同一個 port。適合開發階段或內部工具用。 ...

阿里 Qwen3-Max Preview 登場 2.4 兆引數首創多模態但 benchmarks 在哪裡

- 廣告 - 阿里巴巴在 2026 年 7 月 19 日的 Shanghai WAIC（世界人工智慧大會）上，正式揭開了 Qwen3-Max Preview 的面紗。這個被社群廣泛稱為 Qwen3.8-Max-Preview 的模型擁有 2.4 兆引數，採用稀疏混合專家（MoE）架構，是 Qwen 系列首款突破一兆引數門檻且具備原生多模態輸入能力的旗艦——文字、圖片、影片、檔案都能在同一個模型內處理。阿里把它定位在「僅次於 Fable 5」。問題是：這個說法站得住嗎？下面的內容整理了多個獨立來源，拆解它的規格、能力、定價，還有對開發者可能造成的影響。基本規格速覽專案規格發布日期 2026 年 7 月 19 日（Preview）總引數 2.4 兆（sparse MoE，活躍引數未公佈）上下文視窗 100 萬 token 多模態支援文字、圖片、影片、檔案輸入思考模式 Thinking Mode + Function Calling + Built-in Tools API 相容性 OpenAI & Anthropic Messages API 目前可用性 Token Plan、Qoder、QoderWork（阿里自有平臺）開放權重「即將推出」，無具體日期或授權條款發布背景：為什麼是現在？這個發布時機選得有意思。Kimi K3（2.8T）7/16 才出，Grok 4.5 和 GPT-5.6 Sol 分別是 7/8 和 7/9。Qwen3-Max Preview 卡在 Fable 5 促銷期結束的同一天亮相——開發者正在換模型的時候推新東西，時機抓得準。另外，中國監管機構 7/15 批准了 Apple–Alibaba Qwen 整合案，那時候 Qwen 的關注度本來就高。 ...

AI 正在吃掉世界：從搜尋趨勢看 2026 最爆的 AI 產品

前陣子翻到一份來自 Exploding Topics 的資料包告，裡頭有一個現象讓我盯著螢幕發了三分鐘呆：在他們的全球搜尋熱度排行榜上，「AI Lighting」以 99 倍以上的搜尋成長率霸佔榜首，緊跟在後的「AI Shoes」同樣飆升 99 倍以上，而「AI Earbuds」也衝上了 7,800% 的五年增長曲線。這些不是什麼科幻小說裡的未來產品名稱。它們是現在、就在 2026 年夏天，已經擺在 Amazon、Best Buy 和各大科技展會攤位上等你掏錢的東西。你不會再聽到人們問「AI 是什麼？」——這個階段早就過了。現在人們搜尋的是：用什麼 AI 燈具把客廳調到最適合看球的色溫？哪雙 AI 鞋能在我馬拉松最後五公里幫我修正跑步姿勢？能不能有一副耳機讓我在東京居酒屋跟老闆娘無障礙聊天？ AI Lighting：你的房間開始比你更懂你該開什麼燈 AI Lighting 霸了搜尋榜第一名，是因為它真的在變。從過去單顆智慧燈泡到現在整間房間自己調光，這中間只差了一個協議。 2026 年最關鍵的轉折點是 Matter 2.0 協議的全面普及。過去你買了一個 Philips Hue 燈泡，就得忍受它跟 Google Nest 或 Apple HomePod 之間需要額外中繼器的尷尬；現在不同品牌的智慧燈具可以直接對話，不需要任何橋接硬體。這讓消費者終於敢把整棟房子的照明交給 AI 管理——而不只是客廳那盞吸頂燈。真正有意思的功能叫「預測性晝夜節律同步」。早上自動從 5000K 冷白光開始，傍晚降到 2700K 暖黃，深夜再壓到 1800K 左右——這個數值接近專業畫廊級別的全頻譜照明。你不用管它怎麼調，它就自己跑了。 Signify（原 Philips Lighting）和 Lutron 等大廠開始推「照明即服務」訂閱模式——你買的不只是燈泡，而是持續更新的調光演演算法。2026 年第一季資料顯示，裝設全屋智慧照明的住宅比傳統 LED 省了約 15% 的電。更遠一點的未來——預計在 2027 年——生物適應性照明將開始與你的穿戴裝置（像是手錶或健康貼片）同步。如果你的心率變異度（HRV）顯示你今天壓力偏高，房間的燈光會自動調到你最放鬆的色溫組合。這不是噱頭，是已經在 Beta 測試中的功能。 - 廣告 - AI Shoes：穿在腳上的私人教練與健康管家「AI Shoes」搜尋成長也是 99x+。聽起來像偽概念——鞋子怎麼可能有 AI？但技術其實很實在：三層架構，足底壓力感測器、板載晶片，加上學你走路姿勢的演演算法。 ...

Kimi K3 的 2.8 兆引數宣戰書：中國 AI 如何用開源反攻矽谷

前言 2026 年 7 月 16 日，Moonshot AI 的楊志霖盯著終端機螢幕。Kimi K3 的最後一輪訓練跑完了。損失曲線收斂，基準測試數字出爐——2.8 兆引數。矽谷閉源帝國二十多年來第一次被來自北京的開源模型正面擊中要害。三天後，OpenAI 策略總監 Dean Ball 在 X 上發文：「我很驚訝中國政府持續允許這種等級的開源模型流出。」他預測川普政府最終會用監管不確定性來封殺開源中國模型，稱之為「將監管工具武器化」。然後一場關於開源 versus 閉源的全球大辯論，就此點燃。什麼叫「2.8 兆引數」？ Kimi K3 的總引數是 2.8 兆（trillion），但真正每次前向傳遞只啟動 400 億左右。它用的是 MoE（Mixture of Experts）架構，896 個專家模組中每次只啟用 16 個。你得到的是接近 GPT-4 原始架構三倍大的知識容量，推理成本卻跟中型稠密模型差不多。真正的創新在注意力機制。Kimi K3 用的是 Moonshot 自研的 Kimi Delta Attention（KDA），把線性注意力的骨架和週期性的完整注意力層混合起來。大部分序列用近線性記憶體擴充套件處理，關鍵的全域性層則保留了純線性注意力通常會丟失的長距離依賴關係。 100 萬 token 的上下文視窗下，KDA 比標準 Transformer 注意力減少約 60% 的 KV-cache 開銷。處理整份程式碼庫或厚達上千頁檔案的時候，這不是小進步。基準測試：強項與弱項都擺在檯面上 Moonshot 公佈的 benchmark 數字確實亮眼，但仔細看會發現一些有趣的模式。基準測試 Kimi K3 Claude Opus 4.8 GPT-5.6 Sol SWE-Bench Verified 72.4% 68.1% 74.2% Tau-2（Agentic） 81.7% 76.3% 79.8% AceBench（Tool Calling） 89.2% 84.5% 87.1% MMLU（綜合知識） 89.7% 88.4% 90.1% K3 在程式碼密集型、長視窗的 agentic 任務上表現突出，跟它的架構設計吻合。MMLU 這類綜合知識基準它表現不錯但沒有脫穎而出——2.8 兆引數的主要價值不在於背書更多事實，而在處理複雜關聯和長期推理。 ...

Kimi K3 上線：全球最大開權重模型，前端開發者該升級武器庫了嗎？

2026 年 7 月 16 日，中國 AI 公司 Moonshot AI（月之暗面）正式上線了他們的旗艦模型 Kimi K3。這款定位為「開放型前沿智慧」的模型直接對標 Anthropic 的 Claude Opus 4.8 與 OpenAI 的 GPT-5.6 Sol，宣稱是目前全球最大的開權重 AI 模型。作為一款參數高達 2.8 兆（trillion）的 MoE 架構模型，K3 不只是把數字往上堆，而是在注意力機制、稀疏激活和上下文處理上都做了不少新花樣。這篇文章整理 K3 的核心規格、基準表現、價格結構以及實際使用體驗，幫你判斷它值不值得進你的開發工具鏈。 2.8 兆參數的架構門道 Kimi K3 採用 MoE（Mixture of Experts）架構，總參數量約 2.8 兆，但每處理一個 token 只激活 16 個專家——在全部 896 個路由專家中挑出最相關的。這個 16/896 的激進稀疏比例是業界目前最極端的設計之一，搭配量化感知訓練（MXP4 權重、MXP8 激活值），從 SFT 階段就把推理成本優化進去。 Moonshot 為 K3 設計了三項核心技術來支撐這個龐大體型。第一項是 Kimi Delta Attention（KDA），一種混合線性注意力機制，專門解決長序列處理時的記憶體與速度瓶頸。官方宣稱在百萬 token 情境下解碼速度提升了 6.3 倍。第二項是 Attention Residuals（AttnRes），讓網路深度之間能選擇性地檢索表示，而不是逐層累加，訓練效率提升約 25%，額外計算開銷不到 2%。第三項則是整體縮放效率——Moonshot 宣稱 K3 相較前代 K2 的縮放效率提升了約 2.5 倍，也就是說同樣的計算資源下，K3 能產生更多可用智慧。 ...

NetBird、Tailscale 與 ZeroTier 三校戰：自架 Mesh VPN 該選哪一套？

前陣子在 ivonblog 看到一篇 NetBird 設定教學，說它是「完全開源的客戶端與伺服端」的 WireGuard VPN，就想去挖一挖它的底細。結果越看越發現這東西不只是另一個 Tailscale clone——它在架構設計、授權模式跟 NAT 穿透機制上都有幾處值得單獨拿來說明的地方。這篇文章就把 NetBird、Tailscale 和 ZeroTier 三套主流 Mesh VPN 攤開來比一比，特別聚焦在自架可行性、P2P 連線原理以及實際部署成本上。 - 廣告 - 底層協定：WireGuard vs 自家輪子 NetBird 跟 Tailscale 都建立在 WireGuard 之上。WireGuard 現在已經進到 Linux 內核，大約只有四千行程式碼，加密走 ChaCha20、Curve25519 和 BLAKE2s，安全審查記錄乾淨，效能也是公認的頂尖。NetBird 在 Linux 上甚至直接吃 kernel WireGuard，比 Tailscale 一律用 userspace 還要快一截。 ZeroTier 走的是自己的協定，不依賴 WireGuard。它活了很多年，生產環境驗證充足，但因為是自家輪子，外部安全審視的密度比不上 WireGuard 社群。它的獨家賣點是 Layer-2 支援——能在廣域網上橋接虛擬 LAN，廣播、ARP、甚至 Spanning Tree 都能跨網路跑。這對某些特定場景（像是跨站 Wake-on-LAN 或需要 broadcast discovery 的舊應用）很有用，但對大多數人來說，Layer-3 就夠了。 ...

RPCS3 突破 75% PS3 遊戲相容率：開放原始碼模擬器如何拯救一個世代的遊戲

PS3 模擬器 RPCS3 在 2026 年 7 月中旬宣布了一個讓模擬圈震動的里程碑：相容遊戲數量突破 2,681 款，佔 PlayStation 3 全部已知遊戲庫的 75%。距離 Sony 宣佈將在 2027 年 7 月前關閉 PS3 與 PS Vita 的 PlayStation Store，以及 2028 年起停止生產實體光碟，這個數字不僅是技術上的勝利，更像是一場搶救遊戲歷史的緊急行動。從「幾乎不可能」到「大部分能玩」回想 RPCS3 剛問世的時候，PS3 的 Cell Broadband Engine 處理器被認為是模擬史上最難啃的骨頭之一。Cell 架構擁有一個主 PPE（Processing Element）和七個協處理單元 SPU（Synergistic Processing Elements），每個 SPU 都有自己的本地儲存體且無法直接存取主記憶體。這種獨特的設計讓 x86 PC 要模擬 Cell 的行為，就像是用英文翻譯一種文法完全不同的外語——不僅繁瑣，還得在每一幀之間不斷對齊時間差。到了 2025 年初，RPCS3 的相容率首次突破 70%，當時已經有不少知名大作如《神秘海域 2》、《最後一戰：戰鬥進化》（註：此處應為 The Last of Us）、《鐵拳 6》都能正常運行。進入 2026 年後，開發團隊在 Cell CPU 的 SPU 優化上取得了關鍵突破——主要貢獻者 Elad（GitHub ID: elad335）發現了 Cell 處理器中先前未被記錄的 SPU 使用模式，並據此產生了更高效的原生代碼。這項修正不是針對單一遊戲的 patch，而是提升了整個函式庫的模擬效率。以 SPU 負載極重的《Twisted Metal》為例，平均幀率提升了 5% 到 7%，而即使是較舊的雙核心 AMD 處理器也能感受到明顯改善。 ...

Codex Mini 深度調查：輕量化模型到底能幫你做到什麼程度

前陣子 OpenAI 把 Codex Mini 推到台前，社群討論熱度不低。有人說它是開發者的效率神器，也有人吐槽推理深度不夠用。我花了點時間整理了一份詳細調查報告，從技術規格、Benchmark 數據到實際應用場景都涵蓋了，看看這個輕量化模型到底值不值得你花時間了解。 - 廣告 - Codex Mini 是什麼？為什麼有這麼多版本？ Codex Mini 不是單一產品，而是一系列專為程式開發設計的輕量化 AI 模型。目前市面上能接觸到的主要分為三個版本：第一個是 codex-mini-latest，這是 OpenAI API 用的 CLI 專用版，基底模型基於 o4-mini 微調而來，2025 年 6 月正式推出。它的定位很明確——低延遲、高速的程式碼問答與編輯，API ID 是 codex-mini-latest。第二個版本比較新，GPT-5.1-Codex Mini，2025 年 11 月 13 日推出，基底模型基於 GPT-5.1。這個版本主要給 ChatGPT Plus 和 Pro 用戶用，當你的使用上限到了，可以切換到 Mini 繼續工作。它的 API ID 是 gpt-5.1-codex-mini，成本效益比第一個版本更高。 ...

MiniCPM5-1B 評測把 ChatGPT 的 80% 功能裝進手機裡

前言在大型語言模型（LLM）的戰場上，我們已經聽夠了「千億參數」、「萬卡叢集」這類宏大敘事。然而，2026 年 5 月由 OpenBMB（面壁智能／清華大學聯合團隊）發布的 MiniCPM5-1B，卻反其道而行——僅用 10.8 億參數，就打出了一個令人意外的成績單：在 Artificial Analysis Intelligence Index 上以 17.9 分擊敗了擁有雙倍參數的 Qwen3.5-2B（16.3 分），成為 2B 以下開源模型中的性能王者。這篇文章將從技術架構、基準表現、社群反饋與實際應用場景四個面向，客觀分析 MiniCPM5-1B 到底值不值得你關注。 - 廣告 - 基本規格：小而美的設計哲學 MiniCPM5-1B 的核心規格可以用「精簡」兩個字概括：項目規格參數量 1.08B（非嵌入參數約 680M）架構標準 LlamaForCausalLM Transformer（dense，非 MoE）上下文窗口 131K tokens（約 192 頁 A4 文字） INT4 量化後大小約 0.5 GB FP16 原始大小約 2.2 GB 授權 Apache 2.0 多模態純文本（無視覺能力）值得注意的是，MiniCPM5-1B 採用的是標準 dense Transformer 架構而非 MoE（混合專家），這意味著它的推理路徑更直接、延遲更可預測。在資源受限的設備上，這種設計反而比 MoE 模型更具實用價值——因為 MoE 雖然理論上更高效，但在端側部署時需要額外的路由開銷。 ...

Thinking Machines Lab 推出首款開源模型 Inkling：定位自訂化的多模態 MoE 大語言模型

Thinking Machines Lab 推出首款開源模型 Inkling：定位自訂化的多模態 MoE 大語言模型 2026 年 7 月 15 日，前 OpenAI 首席技術官 Mira Murati 創立的 AI 新創公司 Thinking Machines Lab 正式發布了他們的首款產品——開權重（open-weights）多模態基礎模型 Inkling。這款採用混合專家（Mixture-of-Experts, MoE）架構的模型，定位為「適合自訂化」的通用模型，而非追求單一基準測試的最高分。公司背景：從 OpenAI 到 Thinking Machines Lab Thinking Machines Lab 成立於 2025 年 2 月，總部位於美國加州舊金山。創始團隊陣容堅強，包括前 OpenAI 研究副總裁 Barret Zoph、前 OpenAI VP Lilian Weng，以及 OpenAI 共同創辦人 John Schulman（此前短暫加入 Anthropic）。公司核心成員約 100 人（截至 2026 年），並聘請了來自 OpenAI、Meta AI、Mistral AI 等競爭對手的頂尖研究員與工程師。在資金方面，Thinking Machines Lab 於 2025 年 7 月完成了由 Andreessen Horowitz (a16z) 領輪的早期融資，金額高達 20 億美元，估值達 120 億美元。投資方包括 Nvidia、AMD、Cisco 和 Jane Street Capital。值得一提的是，Mira Murati 的祖國阿爾巴尼亞政府也透過預算修正案投入了 1,000 萬美元。 ...