T. Nukui | ページ 2

独自データでViTモデルをつくる【Vision Transformer】

Vision Transformer（通称：ViT）は画像認識の分野で革命的な技術と言われており、CNNを凌ぐ性能を持つ！とも言われています。今回は独自のデータを使ってViTモデルをつくってみようと思います。ViTは過学習しやすい傾向があるようなのでData Augmentationも試してみます。

2022.02.27

AI実装

Vision Transformerモデルのファインチューニングを試す【ViT解説】

画像分類と言えば畳み込みニューラルネットワーク（CNN）が有名ですが、Vision Transformer（ViT）は画像認識の分野で革命的な技術と言われています。今回はViTをファインチューニングして性能を引き出してみます。

2022.02.21

AI実装

【MiDaS】深度推定モデルをいろんなモノで試してみる

人間は目で見たモノが近くにあるか遠くにあるか、両目から得られた情報を脳で処理することで可能にしています。一方、カメラなど単眼で撮影した画像から距離（深度）を推定することは難しいことです。今回はMiDaSという深度推定AIを用い、一枚の画像でモノの距離を推定してみます。

2022.02.12

AI実装

オブジェクトトラッキングで作物の収穫量を把握する【YOLOv5+DeepSort】

畑や果樹園での作物栽培において収穫量を把握することは重要な要素です。今回は収穫量を把握したいけど、数えるのはめんどくさいという方にオススメな技術になります！独自のデータをつかったオブジェクトトラッキングを実装し、そのデータを利用して収穫量を把握する方法をご紹介します。

2022.02.04

AI実装

【作物の収量を把握】オブジェクトトラッキングを試してみる【YOLOv5+DeepSort】

作物を育てて気になることの一つに「どのくらい収穫できるか？」があると思います。Object TrackingというAI技術をつかって畑にどのくらい収穫できそうなモノがあるかを数えていきます。今回はひとまずObject Trackingの実装編です。

2022.01.30

AI実装

AIでいろんなタイプの架空ポケモンを生成してみる【ruDALL-E】

米BuzzFeedのMax Woolfさんがつくったポケモン生成AIを見つけ完成度の高さに感動。ポケモン生成に用いたruDALL-E技術がオープンソース化されており、なんと２クリックで架空のポケモンが生成できますのでやり方を紹介します。

2022.01.21

AI実装

【Pix2Pix】AIでSNSのアイコンを着色する【自動色塗り】

TwitterやInstagramのアイコンを変えたい！と思うけどなかなか変えられないですよね。私の場合、絵を描くのは好きなのですが色塗りがダメなので面倒になってしまいます。そこで今回は線画を自動着色するPix2PixというAIモデルをつかって着色してみようと思います。

2022.01.19

AI実装

高解像度なInpainting動画をつくってみる【TecoGAN】

画像の一部をまるで"無かったこと"のように消してしまう「Inpainting」というAI技術があります。このInpainting技術と、動画を高解像度化する「TecoGAN」をつかって色々遊んでみました。

2022.01.11

AI実装

Inpainting画像をTecoGANで高解像度化してみた

画像系のディープラーニングをやっていると、画質を上げたくなることがあります。その理由は低解像度な教師データを用いて学習するケースが多いため出力も低解像度になってしまうからです。今回はInpainting画像をTecoGANで高解像度化してみます。

2021.12.31

AI実装

Inpaintingを動画で試してみた【光学迷彩】

Pixel 6の消しゴムマジックみたいに写真の中のモノを消してしまう「Inpainting」というAI技術があります。１枚の画像のInpainting処理にかかる時間が短かったので動画でもできそう！ということで動画で試してみました。

2021.12.23

AI実装