表哥的文章 第46页
WonderJourney:从文字和图片生成3D场景动画 只需要1张图片就可以创建3D场景动画,从用户提供的任何位置(通过文本描述或图像)开始,并通过一系列不同但连贯的 3D 场景生成一个旅程。 从演示效果来看非常流畅,3D游戏或者影视的场景创建要变简单了。而且这还是最近罕见的谷歌会开源的研究。
Generative Powers of Ten:对图像进行无限放大 Generative Powers of Ten,支持对生成的图像进行无限放大,比如讲一张人像照片放大到可以看到细胞结构,从地球大气层缩放到地面上的物体。 通过联合多尺度扩散采样方法实现这一目标,该方法鼓励不同尺度的一致性,同时保持每个单独采样过程的完整性。由于每个生成的比例都由不同的文本...
FaceStudio:在几秒钟内将您的脸放到任何地方 一个保持 AI 画图中人脸特征的技术FaceStudio,可以将你的人脸放在任何地方转换为各种风格,只需要一张照片。 目前 SD一张照片的 的方案还是只有 Ipadapter-face,但是效果没有这个演示好,这个演示再叠加昨天发布的magic animat 照片迁移动画就完美了 哈哈。
Haven:快速创建基于特定任务的 LLM 它可以帮助用户调优开源的大语言模型,使其针对特定任务表现更好。 Haven允许用户在自己的笔记本电脑或私有云上运行已调优的模型,不需要依赖单一公司。与ChatGPT相比,通过Haven调优后的小模型表现会更好。用户可以将调优后的模型部署在AWS或自己的设备上运行。Haven的训练平台可以帮助用户高效地调优模型,不需...
Respell:结合无代码工作流程、代理聊天和 AI 建议来自动化工作 Respell可以帮助用户通过无代码工作流程和语音助手Elle来自动化工作。用户可以使用Respell内置的AI模型或自定义AI代理来创建工作流程。Respell也可以与Notion, Salesforce等工具集成。Respell提供企业级安全功能。用户可以免费试用Respell平台。
MotionCtrl:一个统一灵活的视频生成运动控制器 可以通过手绘的轨迹,控制镜头的运动轨迹和视频中物体的运动轨迹,而且还支持 Animatediff,希望开源之后会有对应的节点插件。 项目优势: 1)它有效地独立控制摄像机运动和物体运动,实现更精细的运动控制,促进两种类型运动的灵活多样组合。 2)它的运动条件由摄像机的姿势和轨迹确定,这些条件与外观无关,...
Magnific AI:AI 图像放大服务 Magnific AI是一个使用AI技术对图像进行放大和增强的服务。它可以使用自然语言描述和各种控件,例如“创造力”滑块来指导放大过程,从而为图像增加更多细节。 Magnific AI可以很好地处理肖像、插画、游戏资产、自然景观、电影照片以及3D渲染等不同类型的图像。它可以实现比原始图像更高分辨率的同时还可以增强图...
Outside:AI 帮你规划你的生活 Outside 是一种新的生活规划者,它可以帮助成千上万的人实现个性化的新体验。现在,你拥有了一种新的创造力和生产力超级能力。Outside 与你的日历连接,通过令人惊叹的摄影将它变得可视化,并在你自己的世界地图上显示你的计划。从计划周末度假或给伴侣带来独特的地方吃饭,Outside 是一个充满活力的社区。
Playground v2:关注美学表现的 SDXL 架构图像生成模型 Playground v2模型开源了权重,用户可以在playground.com或HuggingFace上试用。Playground v2相比Stable Diffusion XL模型在用户评价中更受欢迎2.5倍。然后文章介绍了一个新的基准MJHQ-30K,用于评估模型的审美质量。这个基...
Visual Electric:为创意过程构建的图像生成工具 Visual Electric AI图片生成器。它可以帮助用户通过描述性文字输入快速生成各种风格的图片,比如摄影、电影等主题。用户可以从示例图片库中找到灵感,并通过不断修改输入描述来迭代改进图片效果。Visual Electric还提供了各种功能来帮助用户创作,比如提供建议,调整图片细节,查看不同...