カメラ側で推論可能な話題のOpenCV DepthAIカメラ「OAK-D」 をレビューしてみました。

シェアする?

社員が持ってきてくれたAIKIT

みなさんこんにちは。ネクストシステムの田中です。
本日は今AI界隈で話題のOpenCV DepthAIカメラ「OAK-D」を弊社エンジニアが入手して会社に持ってきてくれたので、触ってみた所感をまとめてみました。

OpenCV DepthAIカメラ「OAK-D」とは?

OAK-Dとは、深度とカラー画像を得られるUSB接続のAIカメラです。両端にモノクロレンズ2つと中央にRGBカメラが付いてます。

通常パソコン側で推論しますが、こちらの製品はなんとカメラ側で推論が可能なのです。つまりパソコンに高性能なGPUは不要。消費電力やPCコストを抑えたい場面で活躍しそう。

また、直販価格も2万円台と大変お求めやすいお値段になっています。

▼OAK-D製造元販売ページ

  USUALLY SHIPS WITHIN 3 BUSINESS DAYS DepthAI is a platform built to allow the power of Spatial AI to be embedded into products. The DepthAI hardware, firmware...

▼日本での販売ページ(スイッチサイエンス)

高度なニューラルネットワークを動作させながら、搭載したステレオカメラ2基と4Kカメラ1基を通して、深度情報と色情報を取得できるAIカメラです。顔認識、オブジェクト検知、オブジェクトトラッキング、Python APIの使用も可能です。

触ってみた所感は?

OAK-Dには以下のようなサンプルのソースコードが用意されてたのでいくつか動かしてみました。

▼サンプルのソースコードはこちらから辿れます。

depthai_demo: 物体検出と深度
age-gender: 年齢性別
coronamask: マスク検出
efficentnet-classification: efficentnetのクラス分類
efficentnetDet: efficentnetDet
face-recognition: 顔認証
fatigue_detection: 居眠り検出
gaze-estimation: 視線推定
head-posture-detection: 頭の向き
human-machine-safety: 危険行動検知
human-pose: 姿勢推定
license-plate-recognition: ナンバープレート識別
palm-detection: 手のひら認識
peaple-counter: 人物カウンター
pedestrian-reidentification: 通行人再識別
social-distance: ソーシャルディスタンス
fire-detection: 火検出

30秒で動作する手軽さ

通常、機械学習のサンプルを動かすのは環境構築と呼ばれる作業が難所の一つです。
物によっては1~2週間かかることもザラ。

しかし、OAK-DはPython3実行環境があればコマンド2つですぐ動きました。

公式サイトにある30秒で動作するという謳い文句は本当です。

代表的なサンプルはステレオカメラによる深度とオブジェクトディテクション(物体検出)で物の三次元座標を表示するものです。20FPSと表示されており、かなり早く動作します。

複数種類の推論の並列動作にも強い?

推論チップはNeural Compute Stick2などで使われるMyriad Xです。

変換はOpenVinoを使いますがこれは比較的簡単に変換ができるのが良いところだと思います。

過去にMyriad Xを使った時の印象としては複数の推論を並列に動作させたときに強いという印象でした。

複数のモデルを組み合わせた課題解決に役立つかもしれません。

深度測定はステレオカメラ方式

深度測定はステレオカメラ方式です。
ステレオカメラ方式がTime of Flight(ToF)方式と比較した利点と欠点は以下です。

■利点
・太陽光下でも使えること
・髪の毛など反射するものがとれること

■欠点
・暗いところでは使えないこと
・模様のない被写体には使えないこと
・繰り返し模様は精度が落ちること
・精度はTime of Flight(ToF)方式に劣ること

また、ステレオカメラの別の使い方として左右のカメラでそれぞれ推論して二次元座標を求め、三角測量で三次元座標を得るという使い方も考えられます。

ラズパイやJetsonでも動作!ハードウェアを含めオープンソース

USB接続のカメラですがUVCには対応していないようです。
今回はWindowsPCで動かしてみましたがラズパイやJetsonでも動作するようです。

またハードウェア含めてオープンソースなのも凄いところですね。

ディープラーニング(深層学習/DeepLearning)の最新技術(VAE,CNN,R-CNN,LSTM,GAN/敵対的生成ネットワーク)やニューラルネットワークなどを利用した、さまざまな最新の人工知能システムを開発しています。 画像認識、映像解析、行動解析、ジェスチャー認識などの開発を行っており、ディープラーニングに...

まとめ

カメラ側で推論できるのでパソコンに高性能なGPUは不要というのがやはり画期的なのでは。
一般ユーザーにも手が届きやすいですよね。

弊社エンジニアが購入したのはステレオカメラ付きのUSB接続の製品ですが、実は亜種が結構あります。USBではなくWiFiやBlueToothや電源供給付有線LAN接続のものや、パソコンとつなぐのではなくラズパイ一体型とかあったりもするんですよね。つなぎ方いろいろで使える幅が広くAIを使うIoTの決定版になりそうな気がします。

ちなみに購入用途としてはゲームで利用したいとのことでした。

ネクストシステムではAI、xR(VR,AR,MR)をはじめとした先端技術開発を多く行なっています。ご相談に合わせて最適な実現方法をご提案をさせていただきますので、お気軽にご相談ください。

▼ネクストシステムの開発事例はこちら

AIをはじめ、xR(AR/VR/MR)などの最先端システムを活用した研究開発を行うネクストシステムの開発事例について紹介しています。紹介している事例は一部のみであり、お客様に合わせてカスタマイズも可能ですのでまずはお気軽にご相談ください。

▼お問合せはこちら

ネクストシステムお問い合わせ

トップへ戻る