В мире искусственного интеллекта произошло нечто невероятное - компания Pika Labs представила обновление своей нейросети для генерации видео, Pika 1.5. Это обновление не просто улучшает качество генерируемого контента, оно буквально взрывает наши представления о том, на что способен ИИ, и эта игра слов в заголовке не спроста, а потому что в новом обновлении вы можете взорвать и расплющить все что угодно!
Что нового в Pika 1.5?
Главная изюминка обновления - функция Pikaffects. Эта инновационная технология позволяет пользователям применять сюрреалистические эффекты к объектам в видео простым нажатием кнопки. Хотите увидеть, как ваша любимая чашка кофе превращается в воздушный шар? Или как символ вашей компании эффектно взрывается? Теперь это возможно!
Вот некоторые из доступных эффектов:
Explode it: объекты эффектно взрываются
Squish it: расплющить как пластелин
Melt it: расплавьте что угодно, словно свечку
Crush it: сплющите объект, как под гидравлическим прессом
Inflate it: раздуйте предметы, словно воздушные шары
Cake-ify it: превратите любой объект в аппетитный торт
Демонстрация возможностей
Чтобы показать вам всю мощь Pika 1.5, я создал несколько изображений с помощью лучшей модели для генерации изображений - Flux, а затем применил к ним эффекты Pikaffects и просто без промпта. Ниже то, что у меня получилось.
Рыцарь Морковного Ордена
Промпт и настройки генерации:
A hyper-realistic portrait, photorealistic photo close-up image of A tiny knight, dressed in shining silver armor that glints in the sunlight, rides atop a fluffy white bunny through a peaceful meadow filled with wildflowers. The knight’s helmet is slightly too big, causing it to tilt to one side, but his tiny sword is held high as he bravely surveys the landscape. The bunny hops along gently, its soft fur brushing against the knight’s armor with each bounce, creating a comical yet adorable sight. Around them, butterflies flit through the air, and birds sing from the branches of nearby trees, adding to the idyllic atmosphere. The knight, despite his small size, exudes a sense of courage and determination, as if ready to take on any challenge that might come their way. The meadow is awash with color, from the vibrant flowers to the lush green grass, making it feel like a perfect day for an adventure. The scene is both charming and whimsical, with the tiny knight and his bunny steed looking like they’ve stepped out of a fairy (photography, high-resolution, dynamic, energetic,hyper-realistic, dramatic lighting, shallow depth of field.), detailmaximizer, MythP0rt<lora:midjourney_whisper_flux_lora_v01:0.55><lora:aidmaMJ6.1-FLUX-V0.1:0.4><lora:FluxMythP0rtr4itStyle:0.4><lora:detailed_flux_ntc:2.2><lora:aidmaImageUpgrader-FLUX-V0.1:0.65>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 2315469810, Size: 768x1280, Model hash: 6e3e5990e9, Model: flux1DevHyperNF4Flux1DevBNB_flux1DevHyperNF4, Denoising strength: 0.35, Original Size: 768x1280, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA)
Без промпта
Explode it
Melt it
Crush it
Inflate it
Cake-ify it
Squish it
Злой Бычок
Промпт и настройки генерации:
aidmaponystyle. cow with shaggy fur, little horns, and a grumpy expression, sitting on a white background, highly stylized cartoon with ultra-realistic texturing, fur or skin with micro-detail visible, extremely expressive and exaggerated grumpy facial features, deep frown, narrowed eyes, furrowed brows, drooping mouth corners, body language reflecting annoyance (crossed arms where applicable, slumped posture), vibrant and intensely saturated colors, sharp and glossy highlights with realistic specular effects, 3D-render-like quality with strong shading and precise lighting to enhance depth, complex digital illustration technique, whimsical, humorous tone, cute appearance with adorable proportions, big eyes, rounded features, with bold black text saying "I HATE PEOPLE" next to the animal, ultra-sharp focus, intricate reflections, ambient occlusion for added realism, subtle backlighting to highlight character edges ,
<lora:Hyper-FLUX.1-dev-8steps-lora:.125>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 2106997802, Size: 1280x768, Model hash: 46947cfc89, Model: STOIQONewrealityFLUXSD_F1DAlpha, Denoising strength: 0.35, Original Size: 1280x768, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Lora hashes: "Hyper-FLUX.1-dev-8steps-lora: 795f8f372bfb", Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA), Module 1: ae, Module 2: clip_l, Module 3: t5xxl_fp8_e4m3fn
Без промпта
Explode it
Squish it
Melt it
Crush it
Inflate it
DJ KITTY
Промпт и настройки генерации:
dark and cyberpunk themed and displays an advertisement for a popular DJ. the poster depicts a DJ who is working the turntables at a rave; the poster focuses on the DJ and his turntables. the DJ is an adorable green kitten with alien ears wearing sunglasses and large headphones. the DJ is focusing completely on his turntables. there is a light show at the rave and different color lights illuminate the DJ from various angles. to either side of him are two huge full stack speakers vibrating with the music. at the top of the poster there is bright neon purple text: "DJ Kitty: most humble bro you know." at the bottom of the poster is also bright neon purple text: "Nostalgic Retro Synthwave."
<lora:Hyper-FLUX.1-dev-8steps-lora:.125>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 3696537514, Size: 768x1024, Model hash: 46947cfc89, Model: STOIQONewrealityFLUXSD_F1DAlpha, Denoising strength: 0.35, Original Size: 768x1024, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Lora hashes: "Hyper-FLUX.1-dev-8steps-lora: 795f8f372bfb", Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA), Module 1: ae, Module 2: clip_l, Module 3: t5xxl_fp8_e4m3fn
Без прмопта
Explode it
Squish it
Melt it
Crush it
Inflate it
Технические улучшения
Помимо захватывающих визуальных эффектов, Pika 1.5 предлагает ряд технических улучшений:
Увеличенная длительность видео (до 5 секунд)
Улучшенное качество изображения
Возможность управления движением камеры через текстовые запросы
Поддержка эмодзи в качестве запросов
О компании
Pika Labs - это не просто очередной стартап. Основанная бывшими PhD-студентами Стэнфордской лаборатории ИИ, Деми Го и Ченлинг Менг, компания привлекла внимание серьезных инвесторов. В 2023 году Pika Labs получила финансирование в размере $55 миллионов, возглавляемое Lightspeed Venture Partners. Среди инвесторов также значатся основатель Quora Адам Д'Анджело и сооснователь Giphy Алекс Чанг.
Что дальше?
Обновление Pika 1.5 открывает новые горизонты для создателей контента, маркетологов и всех, кто хочет добавить в свои видео немного волшебства. Команда Pika Labs обещает и дальше совершенствовать свою технологию, делая создание захватывающих видео доступным для каждого.
Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял и удачных генераций.
Комментарии (11)
RusikR2D2
07.10.2024 10:44+2Это теперь называется "видео"? Видеоролики уменьшались-уменьшались и уменьшились. Гифки и то "лучше" были. А по факту, это просто морфинг картинки..
Cake-ify it кстати начал резать в одном месте, а отрезанный кусочек совсем в другом.
Kkek
07.10.2024 10:44Если MiniMax написать правильный
, то она очень хорошо взрывает то, что попросишь. Я устала ждать результата от Pika и ушла в MiniMax. Очень довольна результатом ночного веселья. Сегодня зашла в Pika, получила результы двух взрывов по пресету, ну - норм.
isNikita
07.10.2024 10:44+3Мне все это напомнило переходы move maker'а ))))
Подобные эффекты имеют ценность, когда они ручками делаются, а от подобного конвейера я устал уже просто прочитав статью.
Genka_pokos
07.10.2024 10:44Вот да, зная что это шаблон в нейросетке, практическая польза от этого стремится к нулю ведь его можно будет легко узнать. В беспонтовую мобильную рекламу пойдет
talraaash
Налетай, торопись, покупай живопись!
От каждого второго поста по нейронкам ощущение рекламы.
Rubilnik
Так каждый второй пост - реклама тг канала)
Тут вообще если примеры генераций убрать с длинным промтом - полезной инфы на 1 абзац.