Generative AI
Generative AI
As AI assistants and agents grow exponentially, they also replicate human creativity. While humans continue to evolve linearly, carrying forward our creative experiences from the past into the future, collaborating with AI introduces new creative experiences for us—perhaps AI feels the same way.
Creating assets
Adobe
Pr
Podcast
Audio
Misc
Podcast talk
audacity 47% audition 33.3
https://twitter.com/MomochiYorozu/status/1660251437644017664?t=QD6pQBMi5VPy_-Ik0JYhiw&s=19
Text to audio
https://huggingface.co/spaces/haoheliu/audioldm-text-to-audio-generation
Free Sound Effects
Adobe Audition
- https://helpx.adobe.com/audition/using/text-to-speeech.html
- https://www.adobe.com/products/audition/offers/AdobeAuditionDLCSFX.html
How to organize
https://blog.prosoundeffects.com/how-to-find-the-right-sound-effects
https://blog.prosoundeffects.com/how-to-use-sound-effects
- prosoundeffects.com
- SoundQ software ⭐️
Whisper
https://community.openai.com/t/whisper-api-a-timecodes-b-how-good-is-open-source-vs-api/163882/5
https://github.com/m-bain/whisperX
Video
- https://generativeai.pub/gen-1-an-amazing-new-generative-ai-video-technology-bb776f5fe8cc
- https://thebridge.jp/2023/06/runway-triples-valuation-in-150-days
Stable Diffusion
Photoshopの画像生成AIがすごい ついに商用利用もスタートへ
人物を切り抜いて、背景だけを生成させた場合は、AdobeFireflyの方が圧倒的に自然
https://k-tai.watch.impress.co.jp/docs/column/stapa/1497045.html
- 「DiffusionBee」 Macで手軽にStable Diffusion
- DreamStudio SD開発元であるStability AIが提供するAI画像生成サービス
Automatic1111
https://ascii.jp/elem/000/004/142/4142488/
Linuxの場合、16GBのVRAMを搭載した互換性のあるAMD製グラフィックボード
https://huggingface.co/blog/lora
Low-Rank Adaptation of Large Language Models
Eagle
https://github.com/bbc-mc/sdweb-eagle-pnginfo/blob/master/README.ja.md
ControlNet
https://github.com/Mikubill/sd-webui-controlnet
Cloud Providers
https://softwarekeep.com/help-center/best-cloud-provider-for-stable-diffusion
- Google Colab Pro
- RunPod
- Vast.ai
- RunDiffusion
- AWS
ONE PAYMENT FOR 24 HOURS
Azure HPC VMでStable Diffusionする
- 200円/時間ぐらい
- Mac Studioで描かせると、7分55秒 Azure VMだと 16秒
Machine Specs
画像生成AIに2度目の革命を起こした「ControlNet」
- 512x768ドットをアップスケールして2倍の1024x1536ドットで出力する場合、
- 1枚当たりの生成時間は、以前「画像生成AI 速いマシンは世界が違う」で紹介した
- DAIVのNVIDIA GeForce RTX4090(VRAM 24GB)搭載機で1分22秒。VRAMの使用率は約65%
https://zenn.dev/karaage0703/articles/bf86fe4946417b
- CPU Intel Core i 7
- メモリ 32GB
- GPU NVIDIA RTX3060(12GB)
- WindowsでもNVIDIA Dockerを入れたら動きました
Stable Diffusionなどの画像生成AI、84,800円(税込)のMac miniがコスパ最強
内蔵GPUで爆速動作するよ
アップルが公式移植している
当然ながらGeForce RTX 4090なんかと比べれば劇遅だけど、コスパと消費電力では圧倒している。
mac mini16GBでautomatic1111動かして512x512の画像で1枚40秒
現状3060のほうが断然速いよ RTX3060で4秒なので約10倍
https://note.com/nice_ixia735/n/nc623d9583357
- M2 Macbook Pro 14inc
- だいたい1分弱で画像が生成
AMDのRadeon系GPU搭載のゲーミングミニPCでAIイラストが生成できる
- Radeon系GPU 約10万円 ゲーミングミニPCの「HX80G」
- 約24秒
10枚のイラスト生成にかかった時間は148秒