発表文献(国内)
2024
2023
- IBISRegression via Classificationを用いた回帰問題に対するストリーム型能動学習堀口翔太, 土肥宏太, 川口洋平第26回情報論的学習理論ワークショップ (IBIS2023), 2023年10月
ストリーム型能動学習では,逐次到着するサンプルに対して予測を行うとともにその不確実性を評価し,不確実性が高いサンプルにはラベルを付与してモデルを再学習する。分類問題に対しては予測クラスへの帰属確率に基づく不確実性評価を用いた様々な手法が提案されてきたが,回帰問題に対する検討は少ない。本研究では回帰問題を分類問題に変換し,分類問題向けに提案された能動学習の手法を回帰問題にも直接適用可能にした。
- ASJ話者数無制限ブロックオンラインダイアライゼーション堀口翔太, 渡部晋治, GarciaPaola, 高島悠樹, 川口洋平日本音響学会 第150回(2023年秋季)研究発表会, 2023年9月
- ASJ1チャンネルおよび多チャンネル話者ダイアライゼーションモデルの相互学習堀口翔太, 高島悠樹, 渡部晋治, GarciaPaola日本音響学会 第149回(2023年春季)研究発表会, 2023年3月
2022
- ASJEnd-to-End音声認識の継続学習における部分パラメータ更新による破滅的忘却の防止高島悠樹, 堀口翔太, 渡部晋治, GarciaPaola, 川口洋平日本音響学会 2022年秋季研究発表会, 2022年9月
- ASJ
- ASJ
- ASJ疑似ラベルを用いた話者ダイアライゼーションの半教師あり適応高島悠樹, 藤田雄介, 堀口翔太, 渡部晋治, GarciaPaola, 永松健司日本音響学会 2022年春季研究発表会, 2022年3月
- ASJグローバルアトラクタとローカルアトラクタに基づく話者数無制限ニューラルダイアライゼーション堀口翔太, 渡部晋治, GarciaPaola, 薛雅文, 高島悠樹, 川口洋平日本音響学会 2022年春季研究発表会, 2022年3月
2017
- ME深層特徴の比較評価 ~ 分類器学習 vs. 距離計量学習 ~堀口翔太, 伊神大貴, 相澤清晴映像情報メディア学会 メディア工学研究会(ME), 2017年2月🏆 映像情報メディア学会 優秀研究発表賞
有用な深層特徴を得ることは画像に関わる全ての課題において重要である.分類器の中間層から抽出した特徴量が有用であることが知られている一方で,end-to-end の距離計量学習によって特徴抽出器自体を学習しようという研究も行われている.しかし距離計量学習の研究の多くは分類器ベースの特徴量を正しく比較していない場合が多く,どちらが優れているのかということは明らかになっていない.本稿では分類器学習ベースの特徴量と距離計量学習ベースの特徴量を比較し,特にデータセット規模が大きい場合に分類器学習の方が特徴量学習に適していることを示す.
- PRMU画像認識器の逐次個人適応堀口翔太, 天野宗佑, 相澤清晴, 小川誠電子情報通信学会 パターン認識・メディア理解研究会 (PRMU), 2017年2月
近年の画像認識タスクは固定データセット内でのパフォーマンスを評価するのが一般的である.しかしこの問題設定は,サンプルやクラスの増加や個人間でのクラス定義の齟齬を考慮しておらず,また画像がクラスごとに十分な枚数あることを仮定してしまっているという点で現実世界を反映しているとは言い難い.本稿では現実世界の画像認識として,逐次学習,ドメイン適応,ワンショット学習の3つの問題を同時に扱う.この問題に対して我々は共通の認識器を逐次的に個人適応させていくSequential Personalized Classifier(SPC)を提案する.SPCは,個人のデータが存在しない初期状態では固定クラスの畳み込みニューラルネットワークと同等の分類精度を出し,個人データを逐次的に学習することでさらに精度を向上させることができる.現実世界でのパフォーマンスを正しく評価するため,個人が日々の食事を記録した画像データセットを用いた.我々の提案するSPCは既存の固定クラス認識手法や逐次的学習手法を大きく上回る精度を達成した.
2016
- MIRU
2015
- ITE画像認識における未知クラス識別の検討水野倫宏, 竹木章人, 堀口翔太, 山﨑俊彦, 相澤清晴映像情報メディア学会 冬季大会, 2015年12月🏆 映像情報メディア学会 学生優秀発表賞
We present a new method of novelty detection in image recognition based on convolutional neural network (CNN). We use Sigmoid Layer as the last layer of a CNN instead of Softmax Layer. As a result, we discovered that a CNN with Sigmoid Layer can detect novelties in an easy dataset better than that with Softmax Layer, but worse in a difficult dataset.
- MIRU
- PRMU物体の画像中の大きさの対数正規性と物体検出への応用 ~ 一般画像データと食事画像データの対比 ~堀口翔太, 相澤清晴, 小川誠電子情報通信学会 パターン認識・メディア理解研究会(PRMU), 2015年3月
多数の検出窓候補に対して分類器を適用して行う物体検出を行う際には,検出枠の縦横比や大きさといったパラメータをあらかじめ決定する必要がある.本稿では,画像中に写る物体のサイズ分布についてモデルを立て,特に食事画像において画像の辺長に対する料理領域のバウンディングボックスの辺長の割合は対数正規分布に従うことを明らかにする.またその分布をselective searchを用いた検出窓候補生成時のパラメータ決定に応用し,食事記録サービス『FoodLog』に登録された画像から作成したデータセットにおいて,少ない検出窓候補数で高いMean Average Best Overlapを実現できることを示す.