スマホのAI処理性能を測定できるベンチマークアプリ「MLPerf Mobile」をMLCommonsがリリースしたので使ってみた

AIインフラストラクチャーのベンチマーク結果を収集している業界団体のMLCommonsがAndroidスマートフォン向けのベンチマークアプリ「MLPerf Mobile」をGoogle Playで公開しました。これまでAPKファイルでしか配布されていなかったベンチマークアプリが簡単に入手できるようになったとのことなので、実際にインストールしてベンチマークを実行してみました。
MLCommons Launches MLPerf Mobile on Google Play Store - MLCommons
https://mlcommons.org/2025/07/mlperfmobile-android/
MLPerf Mobileをインストールするには、まず以下のリンクをタップしてGoogle Playを開きます。
MLPerf Mobile - Google Play のアプリ
https://play.google.com/store/apps/details?id=org.mlcommons.android.mlperfbench
「インストール」をタップしてインストールします。

MLPerf Mobileを起動すると以下の画面が表示されるので「GO」をタップ。

初回は「テスト用のモデルデータのダウンロードが必要」という通知が表示されるので「Download」をタップします。

すると、ダウンロードが始まります。

ダウンロードの進行度は画面の最下部で確認可能。

ダウンロードが完了したら画面左上の矢印ボタンをタップします。

もう一度「GO」をタップするとベンチマークが始まります。「GO」をタップしてからベンチマークが始まるまでに数秒の待ち時間があるので注意。Pixel 7とPixel 9 Pro XLで試したところ、どちらのデバイスでも「Stable Diffusion」による画像生成テストの開始時にアプリがクラッシュしてしまったので、今回は「Stable Diffusion」のテストだけ無効化してから「GO」をタップしました。

ベンチマーク実行中の画面はこんな感じ。各テストの間にシステムをクールダウンするための待機時間が発生します。

テストが完了すると結果画面が表示されます。

Pixel 7とPixel 9 Pro XLのテスト結果は以下の通り。Pixel 9 Pro XLの方がAI処理性能が高いことが分かります。
| テスト内容 | Pixel 7 | Pixel 9 Pro XL |
|---|---|---|
| Image Classification v2 | 257.90 | 265.83 |
| Object Detection | 249.81 | 279.32 |
| Image Segmentation v2 | 237.58 | 422.83 |
| Language Understanding | 90.47 | 123.30 |
| Super Resolution | 30.35 | 52.84 |
| Stable Diffusion | 計測不能 | 計測不能 |
| Image Classification v2 (Offline) | 355.08 | 568.98 |
MLPerf Mobileではベンチマーク結果の履歴を確認することも可能。また、無料アカウントを作成することでベンチマーク結果をクラウド上に保存して別デバイスと共有できるようになります。

・関連記事
AndroidスマホでもiPhoneでもAIモデルをローカルで実行してチャットできる無料アプリ「Cactus Chat」レビュー - GIGAZINE
スマホでローカル動作するGoogle製オープンソースAIモデル「Gemma 3n」登場、今すぐスマホで使う方法はコレ - GIGAZINE
PCやスマホのAI性能を測定できる「Geekbench AI」が登場したので使ってみた - GIGAZINE
「Geekbench 6」リリース、ビデオ会議の背景ボカシや写真からの不要物除去など実用的なベンチマークが可能になったので実際に試してみた - GIGAZINE
CPU・2D・3D・メモリ・ディスクの5項目で徹底的にベンチマークするWindows版「PassMark PerformanceTest」Ver.11レビュー - GIGAZINE
・関連コンテンツ
in AI, ソフトウェア, スマホ, レビュー, Posted by log1o_hf
You can read the machine translated English article MLCommons has released a benchmark app c….







