Lepton团队推出的PromptLLM是提示词生成工具,其To C应用是一个名为PromptCraft的网页工具。用户只需输入一行简短的提示词,PromptCraft就能在几秒内生成一个更加完整、具体的提示词,顺便再用Stable Diffusion XL生成两张图片。 比如我们输入“space shuttle orbiting earth(绕地球运行的航天飞机)”,它就会给我们扩展成“Space shuttle in orbit around Earth, meticulously detailed with intricate features, a spectacle of engineering marvel set against the backdrop of our blue and green ball of life, bathed in the gentle light of the setting sun, Photography, Captured in ultra high definition for a sense of raw, untouched realism”,生成的图片质感也很逼真。 再比如我们输入“伊隆马斯克穿着夏威夷草裙跳舞”,它则帮我们扩充了人物表情、姿态、图片背景、摄影器材等细节,生成的图片效果如下: 在官方的演示中,提供了不少精彩的案例,比如鹦鹉吃胡萝卜、驯鹿亲吻大鹅、狐狸穿袜子、山羊划船等,每一张图都是可以“即出即用”的程度。 当然,在发布案例炫技的同时,贾扬清也不忘及时公布PromptLLM的API链接。从其定价页面可以看到,该工具推出了基础版(免费)、标准版($30/月)和企业版三个版本,根据使用模型的不同,每100万个Token的定价在0.1美元—0.8美元之间。 PromptCraft的底层技术是Lepton AI团队和HippoML共同开发的,其中Lepton AI提供API平台支持,HippoML提供PrivateCanvas系统来保障运行。 HippoML是一家做人工智能基础设施的公司,其目标是专注于降低人工智能软件堆栈的复杂性,让大型(河马,hippo)模型运行得像猎豹一样快。HippoML的主要产品是一个名为PrivateCanvas的应用,集成了Stable Diffusion(XL, LCM), SDXL Inpaint, Segment Anything, ESRGAN, MI-GAN等大模型,可以让用户在本地就使用各种热门大模型的功能。 该公司的创始团队来自Meta,其中包括Bing Xu和Hao Lu两位华人科学家。 而Lepton AI与HippoML之间的合作也并非首次。早在2023年8月,两家就合作推出了号称“最快”的SD扩散模型,同时将代码进行了开源。 而在2023年12月,有眼尖的网友发现,Lepton AI小试牛刀,悄悄上线了一个很有意思的项目:tryemoji,该项目可以把emoji表情变成真实的图像、动画,还提供了不同风格的模板供用户筛选。 贾扬清此前曾在播客中表示,不会做大模型创业,而是会更关注如何帮用户构建更好的AIGC应用,在AI Infra(AI时代连接硬件和上层应用的中间层基础设施,提供基础模型服务、赋能模型微调和应用开发)领域持续发力。
AI+搜索,AI+一切
除了提示词,Lepton AI还向AI搜索工具下手了。 目前,AI搜索领域最明星的产品是 Perplexity AI。不同于谷歌搜索出来的结果是链接,Perplexity会直接生成一段答案,并且在这段答案上方提供一个个附注链接(表明答案来源于这些地方),方便用户自己溯源。 自2022年12月上线以来,Perplexity的产品一直稳定增长,在2023年10月推出订阅制服务后ARR达到了300万美元,月活在2024年1月达到了1000万,并以5亿美元的估值完成了由IVP 领投的 7360 万美元融资。 而就在最近,Lepton AI也做了一款类似于Perplexity的产品。 创业邦在试用Lepton Search后发现,给出的答案质量很高,且提供的信源质量也很高。 Lepton AI的口号是“建立高效的 AI 应用平台(Build AI The Simple Way)”。除了PromptLLM和Lepton Search这两款主打的产品,在他们的官网上,还有各种各样有意思的AIGC产品: 比如OpenVoice,这是一个多功能的即时语音克隆工具,用户只需要输入一段文字,并且上传原始音频片段,就能生成和原说话者一样声音的音频内容,还可以选择不同的语气。 比如Super Resolution ,可以用人工智能生成无损质量的超高分辨率图片。 再比如QR,可以生成各种各样的艺术二维码。