公開:

東芝データがAIによる商品自動分類技術を開発、JANコードなし商品の分類作業を87%以上の精度で効率化へ

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

東芝データがAIによる商品自動分類技術を開発、JANコードなし商品の分類作業を87%以上の精度で効率化へ

PR TIMES より


記事の要約

  • 東芝データがAIによる商品自動分類技術を開発
  • JANコードなし商品の分類作業を大幅に効率化
  • 2種類のAIを組み合わせ87%以上の正解率を実現

東芝データのAIによる商品自動分類技術が商品分析を効率化

東芝データ株式会社は東芝の研究開発センターと共同で、レシート印字名からJANコードがない商品を自動分類するAI技術を2024年11月7日に発表した。LightGMAICグラフニューラルネットワークモデルとレシート分類学習済み大規模言語モデルを組み合わせることで、インストア商品の分類作業を大幅に効率化することが可能になった。[1]

このAI技術は、レシート印字名とその部分文字列との対応関係をグラフ構造として学習させることで、新規のレシート印字名から適切な分類名を判定することができる。また大規模言語モデルを活用することで、レシート印字名特有の省略表現にも対応し、より正確な分類を実現している。

東芝グループの電子レシートサービス「スマートレシート」のデータを用いた検証では、87%以上の正解率を達成している。2025年度中にインストア商品の購買統計データの提供開始を目指すとともに、分類対象を飲食店のメニューにも拡大する予定だ。

AIによる商品自動分類技術の機能まとめ

LightGMAIC 大規模言語モデル
主な特徴 グラフ構造による学習 正誤パターン学習
処理内容 部分文字列との関係性分析 分類名の照合判定
対応機能 優先度付き文字列対応 省略表現への対応
スマートレシートの詳細はこちら

グラフニューラルネットワークについて

グラフニューラルネットワークとは、データ間の関係性をグラフ構造として表現し学習を行う人工知能技術のことを指す。主な特徴として以下のような点が挙げられる。

  • データ同士の関係性を効率的に学習可能
  • 複雑なパターンや構造を把握できる
  • 非構造化データの分析に優れている

商品名の自動分類においては、レシート印字名に含まれる文字列間の関係性を効率的に学習することができる。部分文字列との対応関係や優先度情報をグラフ構造として表現することで、省略表現や表記揺れにも柔軟に対応し、高精度な分類を実現している。

参考サイト

  1. ^ PR TIMES. 「レシート印字名に基づきJANコードがない商品をAIで自動分類する技術を開発 | 東芝データ株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000087.000105826.html, (参照 24-11-08).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。