Episode

【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説 | Singular Radio #12

2025-07-11 · 57:20 ·

ImageNetを席巻し深層学習の夜明けを告げたAlexNet (2012)、そこからPatch＋Attentionで視覚にTransformerを持ち込んだViT、テキスト×画像を結び付けたCLIPへ──そしてGAN、VAE、Diffusionが拓いた画像生成の最前線へ。...

Transcript

クリックでタイムスタンプにジャンプ

字幕がまだ取得できていません。