AI

自動車修理工場向けにAI受付システムを構築した記録


ソフトウェア開発者のケダーシャ・カー氏は、高級車向けの整備工場を営む兄が車の整備中に電話に出られず週に数百件の電話を逃していたことから、AI受付システムの構築を始めました。価格表や営業時間などの実データを参照して質問に答え、分からない内容は折り返し連絡として受け付けるAI受付システムをどう組み上げたのか、カー氏はAIの助けを借りた上で情報をまとめてブログに投稿しています。

How I Built an AI Receptionist for a Luxury Mechanic Shop - Part 1
https://www.itsthatlady.dev/blog/building-an-ai-receptionist-for-my-brother/

カー氏によると、兄が営む高級車向けの整備工場では整備中は電話に出られないことが多いため、週に数百件の電話を逃し、月に数千ドル(約30万円~80万円)規模の機会損失が出ていたそうです。そこでカー氏は工場にかかってくる電話に対応するAI受付「Axle」の開発を始めました。目指したのは、何でも受け答えするチャットボットではなく、営業時間・料金・支払い方法・キャンセルのルール・保証の内容・代車の有無・対応車種などを答えられる工場専用のAI受付システムです。


カー氏が最初に重視したのは、AIが料金やサービス内容を勝手に推測して答えないようにすることでした。たとえば、ブレーキ整備の料金を実際より安く案内してしまうと来店時の説明と食い違ってしまいます。そこで採用したのが、外部のデータを参照しながら答えを作る「RAG」という仕組みです。

カー氏は兄の工場のウェブサイトからサービス内容や価格の情報を取り込み、21件以上の文書でできた知識ベースを作成しました。そして問い合わせが来るたびに質問に合う文書を探し、その文書に書かれている内容だけを使って答える仕組みにしたといいます。

カー氏はAIが参照する情報の保存先としてMongoDB Atlasを使い、各文書をVoyage AIの「voyage-3-large」モデルで1024次元のベクトルに変換して登録しました。なお、ベクトルとは文章の意味を小数を含む数値の並びで表したものです。


こうして取り出した関連文書をAnthropicの「Claude Sonnet4.6」に渡し、「知識ベースにある内容だけを使って短く答えること」「分からない時は分からないと伝えた上で伝言を受けること」という条件で応答させているとのこと。カー氏は、端末上で「オイル交換はいくらか」と尋ねると、「通常、オイルは45ドル、合成油は75ドル、作業時間は約30分」といった形で答えられるようになったと記しています。

次の段階として、カー氏はこの仕組みを実際の電話番号と接続しました。音声まわりの基盤にはVapiを採用し、話した内容を文字にする音声認識にはDeepgram、作った答えを音声として読み上げる音声合成にはElevenLabsをそれぞれ採用しているそうです。

実際の動きとしては、通話中に質問が来るとVapiがFastAPIで作ったWebhookサーバーへ問い合わせを送り、WebhookサーバーがRAGの仕組みで回答を作り、最後にVapiがその回答を音声で読み上げるという構成になっています。開発中は手元のPCで動かしていたサーバーを、ローカルで動くサーバーを一時的に外部公開できるサービスであるNgrokを使って外部からアクセス可能にし、Vapi側から接続できるようにしていたとのことです。

このAI受付システムには質問に答える機能だけでなく、AIでは対応できない場合の仕組みも用意されています。具体的には、Vapi側では質問への回答に使う「answerQuestion」と、名前や折り返し先の電話番号を受け取る「saveCallback」という2つの機能が設定されており、通話の記録や問い合わせの内容、AIがどう答えたか、人間への引き継ぎが必要だったかどうかはMongoDBに保存されます。さらに、答えられなかった質問から発生した折り返し依頼は別の保存先に記録されるそうです。これによって、どんな質問が多いのか、いつ電話が集中するのか、どのくらい人間が対応する必要があるのかも分かるようになるとのこと。

カー氏が特に時間をかけて調整したのは「耳で聞いた時に自然に聞こえるかどうか」でした。画面で読む分には問題ない文章でも、読み上げると不自然になることがあります。たとえば箇条書きや「Certainly!(もちろんです!)」のような決まり文句、「$45.00」のような表記は、音声では違和感が出やすいとのことです。

そのためカー氏は「返答を2文~4文に収めること」「Markdown記法を使わないこと」「金額を『45ドル』のように自然な話し言葉の形にすること」など、音声向けにシステムプロンプトを書き換えました。声そのものも約20種類を試し、最終的には整備工場に合う落ち着いた声を選んだとしています。


カー氏は「AIが知らない内容にどう対応するか」も重視し、知識ベースにない質問には推測で答えず、対応できないことを伝えた上で名前と折り返し先の電話番号を受け付ける流れにしています。さらに、Vapiから不正なリクエストが送られてきた場合や、ベクトル検索で十分に近い文書が見つからない場合、発信者が折り返し先の電話番号を残さない場合などに備えた統合テストも用意したそうです。カー氏は「業務向けの音声AIでは、人へ引き継ぐ流れは例外的な処理ではなく中核機能だ」と述べています。

カー氏によると、2026年3月20日のブログ公開時点でこのAI受付システムは質問への回答と折り返し受付までに対応しているとのことで、今後は通話中に予約を入れられるようにカレンダー連携を追加することや、折り返し依頼が来た際にSMSで通知する仕組み、管理用ダッシュボードを整備することを予定しているそうです。さらに、アプリやサーバーをインターネット上で動かせるクラウドサービス「Railway」上で実際に運用できるよう、セキュリティを強化した上で公開することも計画しているとのことです。

この記事のタイトルとURLをコピーする

・関連記事
無料でローカル動作するAI顧客管理ツール「DenchClaw」は自然言語でデータベースを扱えて見込み客への連絡も自動化可能 - GIGAZINE

AIで簡単にウェブページ上でさまざまなタスクを実行できるようになる「PageAgent」を使ってみた - GIGAZINE

大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか? - GIGAZINE

企業の自動音声サポートは顧客体験に悪影響を与えて顧客離れを引き起こすという調査結果 - GIGAZINE

in AI,   ソフトウェア, Posted by log1b_ok

You can read the machine translated English article Record of building an AI reception syste….