每日AI:英伟达推文生图模型ConsiStory;高度可控AI试衣OOTDiffusion;开发者推SoraWebui开源项目;-程序员宅基地

技术标签: AI日报  人工智能  

图片

新鲜AI产品点击了解:https://top.aibase.com/

AI应用

英伟达推出免训练,可生成连贯图片的文生图模型ConsiStory

图片

【AiBase提要:】

️ 多数文生图模型使用随机采样模式,导致生成图像不连贯

️ AI生成连贯图像连环画难度大,现有模型效果有限

️ ConsiStory是一种免训练连贯文生图模型,可提升图像一致性和连贯性

论文地址:https://arxiv.org/abs/2402.03286

OOTDiffusion:一个高度可控的虚拟服装试穿AI工具

图片

【AiBase提要:】

️ 高度可控的虚拟服装试穿工具

️ 按性别和体型自动调整,与模特身形贴合

️ 支持半身模型和全身模型,试穿效果自然逼真

项目地址:https://top.aibase.com/tool/ootdiffusion

试玩地址:https://ootd.ibot.cn/

Sora还没正式开放 有开发者已经搞出了SoraWebui

【AiBase提要:】

Sora因视频生成效果惊艳火爆出圈,但仍在内测阶段,多数用户只能看。

️ SoraWebui开源项目提前研究,模拟API接口字段实现,为未来上线做准备。

开源项目支持Vercel一键部署,便于开发者使用和测试。

项目地址:https://top.aibase.com/tool/sorawebui

Adobe推类ChatGPT助手AI Assistant 并集成到PDF中

图片

【AiBase提要:】

Adobe推出生成式AI助手AI Assistant

AI Assistant类似于ChatGPT,提供摘要、核心见解

用户可通过AI生成引擎验证答案来源,提升Reader和Acrobat的商业价值

谷歌AI推出ScreenAI:用于UI和信息图解读的视觉语言模型

【AiBase提要:】

️GoogleAI团队推出了ScreenAI,一个视觉语言模型。

️ScreenAI在多个任务上表现出色,包括图形问答和摘要生成。

️发布了三个新数据集,为未来研究提供更多资源。

论文地址:https://arxiv.org/abs/2402.04615

FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法

图片

【AiBase提要:】

️支持多个条件、架构和检查点同时进行控制生成

️通过结构和外观引导,实现对生成图像的控制

️展示了 T2I 扩散模型进行可控生成的定性结果

项目网址:https://top.aibase.com/tool/freecontrol

Comfyui更新Stable Cascade 7个模型整合为两个模型文件

【AiBase提要:】

简化操作流程,用户只需选择C和B阶段的模型文件

提高用户便利性,更新后生成的图片质量和美观度显著提升

但更新带来伪影问题,期待官方修复,提升用户体验

项目地址:https://top.aibase.com/tool/stable-cascade

工作流及模型下载:

https://comfyanonymous.github.io/ComfyUI_examples/stable_cascade/

Reddit大佬开发GLIGEN GUI 可指定图像大小、位置等

图片

【AiBase提要:】

️ GLIGEN GUI让用户可以控制生成图像的大小、位置和元素之间的空间关系

️ GLIGEN可以根据自然语言描述生成高质量的图像

️ GLIGEN提供灵活性和创造性,让用户创造惊人的图像作品

GLIGEN GUI项目地址:https://top.aibase.com/tool/gligen-gui

GLIGEN项目地址:https://top.aibase.com/tool/gligen

目标检测跟踪模型YOLOv8能快速识别和定位多个对象

图片

【AiBase提要:】

YOLOv8是一种先进的目标检测跟踪模型

支持多种格式部署,提高了模型的可用性和兼容性

适用于多种领域,包括安防监控、医疗图像分析、自动驾驶等

项目地址:https://top.aibase.com/tool/yolov8

FiT:一种全新的Transformer架构图像生成模型 分辨率和高宽比不受限制

【AiBase提要:】

FiT将图像视为一系列可变大小的图像块(Token)

FiT在处理不同分辨率的图像方面表现出卓越性能

FiT为生成不受限制的图像提供新的解决方案

项目地址:https://top.aibase.com/tool/fit

AnyGPT:实现任意模态输入到任意模态输出

图片

【AiBase提要】

️ 采用离散表示技术,实现多模态输入的统一处理

灵活性: 可稳定训练并轻松集成新模态

实用性: 生成大规模多模态指令数据集,实现任意多模态对话

产品入口:https://top.aibase.com/tool/any-gpt-

AI新鲜事

Groq最快AI推理芯片成本推算高得离谱 运行LIama2得1171万美元

图片

【AiBase提要:】

️ Groq公司推出AI芯片与英伟达GPU性价比对比

运行LIama2所需成本高达1171万美元

分析师评估成本效益,Groq需面对英伟达竞争

项目入口:https://top.aibase.com/tool/groq

马斯克X平台与Midjourney正商谈合作 致力于生成式AI项目

【AiBase提要】

️ Elon Musk的X与Midjourney商谈合作,可能推动生成式人工智能项目。

可能合作在选举前识别X平台上的GenAI内容,推动人工智能技术应用。

Midjourney的生成式AI计划可根据自然语言描述生成图像,与其他项目类似。

B站UP主让AI修习春山学 视频播放量近200万

【AiBase提要:】

️ 央视春晚《上春山》引发热议,UP主让AI修习春山学。

️ AI识别节目表演者面部情绪,实时显示在视频中。

️ AI情绪识别技术或带来更多便利和乐趣。

AIbase副业搞钱交流群

欢迎大家加入AIbase交流群, 扫码进入,畅谈AI赚钱心得,共享最新行业动态,发现潜在合作伙伴,迎接未来的赚钱机遇!

图片

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/AIbase2024/article/details/136248941

智能推荐

论坛集_77论坛-程序员宅基地

文章浏览阅读1.3w次。000013 001http://people.sina.com.cn/forum.html新浪网论坛 000015 002http://club.sohu.com/搜狐社区 000020 003http://bj.163.com/网易北京社区 000043 004http://bbs.tom.com/bbs.phpTOM海云天论坛 000143 005http://bbs.china.com/中_77论坛

python-字符串中使用%%有什么作用?%操作符的各种用法小结_python %%-程序员宅基地

文章浏览阅读1.3w次,点赞6次,收藏43次。python-字符串中使用%%有什么作用?%操作符的各种用法小结_python %%

统计平均分:从文本读取成绩并计算平均分,将平均分写入文本文件保存_包含学生考试成绩的源文本文件中提取并计算平均分-程序员宅基地

文章浏览阅读1.2k次。从文本读取成绩并计算平均分,将平均分写入文本文件保存。【学习的细节是欢悦的历程】Python官网Free:大咖免费“圣经”教程python 完全自学教程,不仅仅是基础那么简单……自学并不是什么神秘的东西,一个人一辈子自学的时间总是比在学校学习的时间长,没有老师的时候总是比有老师的时候多。——华罗庚HOT好文力荐从文本读取成绩并计算平均分统计平均分(将平均分写入文本文件保存)本文质量分:90目 录。_包含学生考试成绩的源文本文件中提取并计算平均分

[Intensive Reading]MOT:FairMOT_fairmot实现mot评估-程序员宅基地

文章浏览阅读2.1k次,点赞5次,收藏10次。简介《FairMOT:A Simple Baseline for Multi-Object Tracking》是一个online的多目标跟踪(MOT)算法,基于TBD(Traking-by-Detection)的策略,FairMOT主要就是基于JDE做的改进,可以简单的理解为,FairMOT是将JDE的YOLOv3的主干,改成了CenterNet,也就是将检测的方法由Anchor-base换成了Anchor-free,然后同样在已有检测模型上加了了embeeding分支,模型输出检测的结果和embeedi_fairmot实现mot评估

VS 2008 显示代码行数/改变程序格式风格_vs2008显示行数-程序员宅基地

文章浏览阅读3.9k次。VS 2008 显示代码行数:开发环境C#,其他类同操作。工具-》选项-》文本编辑器-》C#里的显示“行号”勾上即可。-------------------------------------------------------------------------------------------------------改变VS程序风格:java风格: private v_vs2008显示行数

Web前端设计全方位解析:面试题总结+答案详解_前端实现填空题-程序员宅基地

文章浏览阅读1.5k次,点赞21次,收藏29次。面试习题大总结,进来免费白嫖啦_前端实现填空题

随便推点

针对连续动作的DQN_dqn连续动作-程序员宅基地

文章浏览阅读6k次,点赞4次,收藏17次。1 前言跟基于策略梯度的方法比起来,DQN在处理连续状态的问题中 是比较好的。(因为前者是计算Q-table,后者是计算Q-function。前者在状态空间连续的时候是很难计算的)。 同时,DQN是比较容易训练的:在 DQN 里面,你只要能够估计出Q函数,就保证你一定可以找到一个比较好的策略。也就是你只要能够估计出Q函数,就保证你可以改进策略。而估计Q函数这件事情,是比较容易的,因为它就是一个回归问题。在回归问题里面, 你可以轻易地知道模型学习得是不是越来越好,只要看那..._dqn连续动作

【C程序】获取文件最后一次修改时间_c语言获取文件修改时间-程序员宅基地

文章浏览阅读1.2w次,点赞4次,收藏24次。获取文件的最后一次修改时间,用于判断可能的使用场景:1、文件是否被修改了2、新的内容是否写入文件了3、对比时间来找到最后被修改的文件等等...#include <stdio.h>#include <sys/types.h>#include <sys/stat.h>#include <unistd.h>int get_old_file_tim..._c语言获取文件修改时间

Sql注入之sqlmap+dvwa实例演练-程序员宅基地

文章浏览阅读927次。Sql注入之sqlmap+dvwa实例演练 相信很多同学都已经知道了什么是sql注入,也明白为什么会发生sql注入。也可以通过在输入框和url中“手工”注入,来实现绕过登录、非法修改这样有趣又实用的功能。但这些还远不能让我们感觉到sql注入的巨大威力。你也一定听过各种各样的新闻报道xxx网站被黑,上百万用户数据泄露。想知道它们是如何获得这些数据的吗?不讲过多原理,就和实验楼的【S..._模拟一次sql注入操作实例dvwa

在VUE中使用swiper,swiper全屏滑动_vue swiper组件上下滑动全屏-程序员宅基地

文章浏览阅读5.6k次。1,安装npm install --s vue-awesome-swiper2,在main.js中使用import vueAwesomeSwiper from 'vue-awesome-swiper'Vue.use(vueAwesomeSwiper);3,在页面使用<template> <div class="home"> <s..._vue swiper组件上下滑动全屏

百度ueditor富文本编辑器支持从word复制粘贴保留格式和图片的插件_ueditor怎么设置只保留编辑文字的功能插件-程序员宅基地

文章浏览阅读266次。tinymce是很优秀的一款富文本编辑器,可以去官网下载。https://www.tiny.cloud这里分享的是它官网的一个收费插件powerpaste的旧版本源码,但也不影响功能使用。umeditor+粘贴word图片 – 泽优软件博客以vue为例说明:将tinymce下载后放到static目录下,不用npm安装。powerpaste放到\static\tinymce\plugins目录下在index.html中引入tinymce.min.js。代码参数配置如_ueditor怎么设置只保留编辑文字的功能插件

linux catalina.sh java_opts,Tomcat启动脚本catalina.sh---解读-程序员宅基地

文章浏览阅读1k次。原网址:http://blog.csdn.net/sun8288/article/details/78431271 - 概述脚本catalina.sh用于启动和关闭tomcat服务器,是最关键的脚本另外的脚本startup.sh和shutdown.sh都是使用不同的参数调用了该脚本该脚本的使用方法如下(引自该脚本本身):echo "Usage: catalina.sh ( commands ......_catalina.sh java_opts

推荐文章

热门文章

相关标签