Episode
【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説 | Singular Radio #12
2025-07-11 · 57:20 ·
ImageNetを席巻し深層学習の夜明けを告げたAlexNet (2012)、そこからPatch+Attentionで視覚にTransformerを持ち込んだViT、テキスト×画像を結び付けたCLIPへ──そしてGAN、VAE、Diffusionが拓いた画像生成の最前線へ。...
Transcript
クリックでタイムスタンプにジャンプ
字幕がまだ取得できていません。