把离线开源大模型塞进你手机里---Google AI Edge Gallery APP重大更新，无需网络在你的手机上运行Gemma 4 DeepSeek Qwen等

引言及下载地址

Gemma 4 已经正式发布，Google近期也更新自家的Edge Gallery。这是一款可以在你手机上运行各类模型应用，可以去应用商店

Google Play下载
 苹果App Store下载
 Github下载

Google 开源代码 https://github.com/google-ai-edge/gallery 。

功能上包括 Chat、图像生成、音频处理，本次还更新了两个功能，分别是 Agent Skills 和 Mobile Actions。目前全球已经有4亿下载。

Gemma 4简介

Gemma 4的核心卖点粗暴直接：文本、图像、音频全在本地处理。不需要Wi-Fi，不需要5G，不需要把聊天记录同步到某个遥远的数据中心。
Google给手机端准备了两个型号。E2B（2B有效参数）量化后约1.3GB，6GB内存即可运行；E4B（4B有效参数）约2.5GB，需要8GB内存。这里的"E"代表effective parameters（有效参数），即推理时真正激活的参数数量，而非模型总参数量。
而且与Arm、Qualcomm的联合优化让数字变得好看：Android端运行速度比上一代提升4倍，耗电降低60%。Arm自家测得更激进——在新款Arm芯片（支持SME2指令集）上，平均加速达到5.5倍。SME2是Arm为AI矩阵运算做的硬件级扩展，相当于给手机芯片装了专门的数学加速器。
系统最低要求：Android 12或iOS 17。当然内存RAM是硬门槛，最低需要6GB或8GB，这个把老旧机型挡在门外，不过只要你的手机不是太老都可以运行。

Gemma 4基于与Google闭源Gemini 3相同的研究成果，但选择了Apache 2.0许可证。这意味着企业可以免费用、改、商用，没有专利陷阱，没有"仅供研究"的小字条款。这一点不同于国内AI厂商。
服务器端还有两个更大版本：26B（混合专家架构，128个专家，单次推理激活3.8B参数）和31B（稠密模型，上下文窗口256K token）。手机端用E2B/E4B，服务器端用26B/31B，Google用一套技术栈覆盖了从边缘到数据中心的完整光谱。