在 Google I/O '24 上,我们揭示了以 AI 为核心的 Android 重新构想的愿景。在本视频中,了解针对 Android 开发人员在 Android 上构建 AI 的三个主要更新。
选择适合您的生成式 AI 解决方案
本文档概述了 Android 上的生成式 AI,包括可用的 Gemini 模型和相关的 SDK。
高性能设备端 AI
在受支持的 Android 设备上,您可以提供丰富的生成式 AI 体验,而无需网络连接或将数据移出设备。设备端生成式 AI 模型(如 Gemini Nano)非常适合需要低延迟、低成本和隐私保护的用例。
用例
- AI 增强的内容消费:文本摘要、文档问答和实体提取。
- AI 辅助的内容生成:校对、语法修正、写作辅助和上下文智能回复。
- 文本分类:情感或情绪分析
- 隐私:在将数据保留在设备上的同时解锁生成式 AI 功能
解决方案
使用 Google AI Edge SDK 利用设备端的 Gemini Nano 推理。Gemini Nano 现已公开提供实验性访问。
通过 Play for On-device AI 更有效地为设备端 AI 功能提供自定义模型。Google Play 简化了设备端模型的发布、定位、版本控制、下载和更新,帮助您提升用户体验,同时优化应用大小。Play for On-device AI 可免费使用。如果您有兴趣参与 Play for On-device AI 的抢先体验,请填写表格。
使用 Google 最强大的模型的多模态云 AI
您可以通过利用在云端运行推理的基础模型(如 Gemini Pro 模型)在您的应用中创建多模态生成式 AI 体验。当您希望支持尽可能广泛的 Android 设备时,这些模型是一个极佳的解决方案。
用例
- 图像和视频描述和字幕:识别对象并以文本形式进行描述
- 多模态推理:处理文本、图像和视频内容
- 文本生成:总结文章、回答有关文本内容的问题、提取实体。
- 响应格式化:将模型响应格式化为 JSON 或 Markdown
解决方案
对于生成式 AI 功能的原型设计,您可以从 Google AI 客户端 SDK 开始。此 SDK 使您可以访问 Gemini API,并有助于简化应用与 Gemini 模型的交互。Google AI 客户端 SDK 处于预览阶段,应仅用于原型设计。
要将您的 AI 体验投入生产,请使用 Firebase 中的 Vertex AI。与 Google AI 客户端 SDK 类似,此 Firebase SDK 提供对 Gemini 模型的访问权限,但也提供了对生产应用至关重要的安全性和配置选项。此外,Firebase 还包括跨各种移动平台的生产级支持和功能。
了解有关 Firebase 中的 Vertex AI 的更多信息
企业 AI
Vertex AI 是 Google 的完全托管的统一 AI 开发平台。企业可以使用 Google 的 Vertex AI 平台通过后端集成向 Android 设备提供定制的 AI 体验。在 Google 可扩展的世界一流基础设施上构建、训练和部署 AI 应用。对于企业级 AI 而言,这是一个极佳的解决方案,可访问 130 多个模型和工具,包括 AI Studio、Agent Builder 和 Gemini 模型。
用例
- 自定义模型训练和交付
- 图像和视频生成
- 虚拟代理、客户支持
- 语音到文本、自然语言处理
解决方案
使用 Google 的 Vertex AI 平台构建自定义 AI 应用并将 Android 应用连接到服务层。
其他资源
负责任的生成式 AI 工具包
AI 模型应符合安全策略,并对其公平性和准确性进行评估,并设计为透明的。 负责任的生成式 AI 工具包 为您提供帮助和指导,以便您负责任地设计、构建、评估和部署开放式 AI 模型。
Android Studio 中的 Gemini
Android Studio 中的 Gemini 是 Android 开发的编码助手。它由人工智能提供支持,并可以理解自然语言。它通过回答您的 Android 开发问题帮助您提高工作效率。Gemini 可以帮助您查找相关资源、学习最佳实践并节省时间。
Gemini API 启动模板
Gemini API 启动模板 紧密遵循 Android 上 Gemini 入门的在线快速入门指南。它利用适用于 Android 的 Google AI 客户端 SDK,并展示了如何使用文本提示和模型响应。
参考
Android 上 Gen AI 的 Google API 和 SDK
环境 |
API 或 SDK |
支持的模型 |
可用性 |
推荐用法 |
与设备端推理的 Android 集成 |
Gemini Nano |
公开实验性访问 |
实验性 |
|
与云端推理的 Android 集成 |
Gemini 1.5 Flash |
公开预览 |
仅限原型设计 |
|
Gemini 1.5 Flash |
普遍可用 (GA) |
推荐用于生产 |
||
与云端推理的后端集成 |
130 多个基础模型(包括 Gemini 1.5 模型) |
普遍可用 (GA) |
推荐用于生产 |
|
与设备端推理的 Android 集成 |
Gemma 2B 稳定版 LM 3B Phi-2 |
实验性 |
Google 生成式 AI 模型
Google 提供多种生成式 AI 模型,您可以在 Android 应用中使用。
环境 |
模型 |
类型(成本) |
支持的输入格式 |
输出数据 |
设备端 |
Gemini Nano |
免费 |
文本,图像 |
文本 |
云端 |
Gemini 1.5 Flash |
免费/付费 |
文本,图像,视频,音频 |
文本 |
Gemini 1.5 Pro |
免费/付费 |
文本,图像,视频,音频 |
文本 |
|
Gemini 1.0 Pro |
免费/付费 |
文本 |
文本 |
|
设备端,云端 |
Gemma & Gemma 2 |
免费(开源模型) |
文本 |
文本 |
有关每个模型功能(包括令牌和速率限制)的完整详细信息,请参阅 Gemini 模型。