围绕Zara这场直播,在业内引发了不少讨论。
但仅仅七年后,很多事情都发生了变化。
专利的大型语言模型如 GPT-4被用来生成包括多语言指令在内的各种合成数据。通过利用 Mistral 模型强大的语言理解能力,该方法在几乎所有工作类别上在激烈竞争的 MTEB 基准测试中取得了出色的性能。
其次是保持一致性,修正手部的同时不会影响图像的整体质量,保持了图像其他部分的一致性。另外,HandRefiner利用合成数据进行训练,这使得它能够有效地处理真实手和合成手之间的域差异,学习不同手的样子,并找到合适的方式来修正手部。
7️⃣ ScriptGPT 🚀