引言及下载地址
Gemma 4 已经正式发布,Google近期也更新自家的Edge Gallery。这是一款可以在你手机上运行各类模型应用,可以去应用商店
Google Play下载
苹果App Store下载
Github下载
Google 开源代码 https://github.com/google-ai-edge/gallery 。
功能上包括 Chat、图像生成、音频处理,本次还更新了两个功能,分别是 Agent Skills 和 Mobile Actions。目前全球已经有4亿下载。
Gemma 4简介
Gemma 4的核心卖点粗暴直接:文本、图像、音频全在本地处理。不需要Wi-Fi,不需要5G,不需要把聊天记录同步到某个遥远的数据中心。
Google给手机端准备了两个型号。E2B(2B有效参数)量化后约1.3GB,6GB内存即可运行;E4B(4B有效参数)约2.5GB,需要8GB内存。这里的"E"代表effective parameters(有效参数),即推理时真正激活的参数数量,而非模型总参数量。
而且与Arm、Qualcomm的联合优化让数字变得好看:Android端运行速度比上一代提升4倍,耗电降低60%。Arm自家测得更激进——在新款Arm芯片(支持SME2指令集)上,平均加速达到5.5倍。SME2是Arm为AI矩阵运算做的硬件级扩展,相当于给手机芯片装了专门的数学加速器。
系统最低要求:Android 12或iOS 17。当然内存RAM是硬门槛,最低需要6GB或8GB,这个把老旧机型挡在门外,不过只要你的手机不是太老都可以运行。
Gemma 4基于与Google闭源Gemini 3相同的研究成果,但选择了Apache 2.0许可证。这意味着企业可以免费用、改、商用,没有专利陷阱,没有"仅供研究"的小字条款。这一点不同于国内AI厂商。
服务器端还有两个更大版本:26B(混合专家架构,128个专家,单次推理激活3.8B参数)和31B(稠密模型,上下文窗口256K token)。手机端用E2B/E4B,服务器端用26B/31B,Google用一套技术栈覆盖了从边缘到数据中心的完整光谱。
功能演示
你可以在你手机本地离线运行AI大模型。目前支持众多模型,而安卓版本相对更新,额外支持国产 DeepSeek和Qwen模型。未来Google会开放更多模型支持。
Agent Skills 可以在本机执行各种 Skill 调用,相当于手机上的一个智能体。
而 Mobile Actions 则可以通过自然语言操作手机。

