Generative AI
Creating assets
Adobe
Pr
Podcast
Audio
Misc
Podcast talk
audacity 47% audition 33.3
https://twitter.com/MomochiYorozu/status/1660251437644017664?t=QD6pQBMi5VPy_-Ik0JYhiw&s=19
Text to audio
https://huggingface.co/spaces/haoheliu/audioldm-text-to-audio-generation
Free Sound Effects
Adobe Audition
- https://helpx.adobe.com/audition/using/text-to-speeech.html
- https://www.adobe.com/products/audition/offers/AdobeAuditionDLCSFX.html
How to organize
https://blog.prosoundeffects.com/how-to-find-the-right-sound-effects
https://blog.prosoundeffects.com/how-to-use-sound-effects
- prosoundeffects.com
- SoundQ software ⭐️
Whisper
https://community.openai.com/t/whisper-api-a-timecodes-b-how-good-is-open-source-vs-api/163882/5
https://github.com/m-bain/whisperX
Video
- https://generativeai.pub/gen-1-an-amazing-new-generative-ai-video-technology-bb776f5fe8cc
- https://thebridge.jp/2023/06/runway-triples-valuation-in-150-days
Stable Diffusion
Photoshopの画像生成AIがすごい ついに商用利用もスタートへ
人物を切り抜いて、背景だけを生成させた場合は、AdobeFireflyの方が圧倒的に自然
https://k-tai.watch.impress.co.jp/docs/column/stapa/1497045.html
- 「DiffusionBee」 Macで手軽にStable Diffusion
- DreamStudio SD開発元であるStability AIが提供するAI画像生成サービス
Automatic1111
https://ascii.jp/elem/000/004/142/4142488/
Linuxの場合、16GBのVRAMを搭載した互換性のあるAMD製グラフィックボード
https://huggingface.co/blog/lora
Low-Rank Adaptation of Large Language Models
Eagle
https://github.com/bbc-mc/sdweb-eagle-pnginfo/blob/master/README.ja.md
ControlNet
https://github.com/Mikubill/sd-webui-controlnet
Cloud Providers
https://softwarekeep.com/help-center/best-cloud-provider-for-stable-diffusion
- Google Colab Pro
- RunPod
- Vast.ai
- RunDiffusion
- AWS
ONE PAYMENT FOR 24 HOURS
Azure HPC VMでStable Diffusionする
- 200円/時間ぐらい
- Mac Studioで描かせると、7分55秒 Azure VMだと 16秒
Machine Specs
画像生成AIに2度目の革命を起こした「ControlNet」
- 512x768ドットをアップスケールして2倍の1024x1536ドットで出力する場合、
- 1枚当たりの生成時間は、以前「画像生成AI 速いマシンは世界が違う」で紹介した
- DAIVのNVIDIA GeForce RTX4090(VRAM 24GB)搭載機で1分22秒。VRAMの使用率は約65%
https://zenn.dev/karaage0703/articles/bf86fe4946417b
- CPU Intel Core i 7
- メモリ 32GB
- GPU NVIDIA RTX3060(12GB)
- WindowsでもNVIDIA Dockerを入れたら動きました
Stable Diffusionなどの画像生成AI、84,800円(税込)のMac miniがコスパ最強
内蔵GPUで爆速動作するよ
アップルが公式移植している
当然ながらGeForce RTX 4090なんかと比べれば劇遅だけど、コスパと消費電力では圧倒している。
mac mini16GBでautomatic1111動かして512x512の画像で1枚40秒
現状3060のほうが断然速いよ RTX3060で4秒なので約10倍
https://note.com/nice_ixia735/n/nc623d9583357
- M2 Macbook Pro 14inc
- だいたい1分弱で画像が生成
AMDのRadeon系GPU搭載のゲーミングミニPCでAIイラストが生成できる
- Radeon系GPU 約10万円 ゲーミングミニPCの「HX80G」
- 約24秒
10枚のイラスト生成にかかった時間は148秒