模型下载地址:https://top.aibase.com/tool/mickey-1928
小型语言模型(SLM)已经出现,成本效益和可持续发展的考虑将加速这一趋势。
DeWave功能展示
然后,HandRefiner采用条件修补方法来处理识别出的问题手部。它生成一个深度图,其中包含了关于手部形状和位置的重要信息。这个深度图被用作指导,通过ControlNet集成到扩散模型中。最后,HandRefiner将重新画好的手部放回原来的画作中,替换掉原本画错的手,而其他部分保持不动,保持了原画的风格和内容。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。