midjourney的风格是简单、直接、高效,所有精力集中在模型上,不做app,也不做网站。
如今,不知道midjourney这家公司,似乎就不配谈aigc。
不久前,ai绘图工具midjourney发布了第五代v5模型,由它生成的一张“中国情侣”图片因效果酷似真人而火爆出圈。紧接着,又进一步宣布推出针对二次元、动漫风格的版本。
图源:网络
新版midjourney,用户使用风格化命令,就能轻而易举地生成大师级作品。以高频迭代速度不断优化使用体验,一时间,针对midjourney的极简入门法则、使用攻略、进阶玩法、变现指南等在网上被广泛传播。
大量新用户的涌入,再加上gpu临时性短缺,导致midjourney付费用户的服务陷入了瘫痪。为此,公司只好叫停免费试用。
有机构用“产品效果惊艳”评价midjourney。作为文生图领域的“领跑者”,midjourney由david holz创立于2021年8月,仅拥有11名全职员工,成立至今未融过资,却凭借着付费订阅的商业模式,实现年营收1亿美元。
资料来源:the information 凯发k8国际手机app下载官网
就是这样一个仅有11人的小公司,没有任何外部重金投入,却成为ai绘画领域的“当红明星”,甚至将同类型的公司都甩在其后。
现如今,midjourney在聊天软件discord上已经积累了将近1500万用户,这家公司也成了了解ai绘画无法绕开的公司。
“我们没有压力销售什么东西,也不用成为上市公司,只是为了未来十年能够有一个家,可以从事很多比较有意义的、酷的项目,希望不仅是对我,还是对世界有意义,并且享受乐趣。”一年半前,midjourney创始人david holz在接受媒体采访时表示。
在david holz的蓝图中,他要打造的是一个“想象力引擎”,他认为想象力是人们在世界上所需东西的重要支柱。而同时,人们可以把aigc变成一种力量,扩展人类的想象力。
midjourney凯发k8国际手机app下载官网上,关于david holz的此前经历的介绍非常简洁:leap motion创始人;nasa和max planck研究员。
图源:midjourney凯发k8国际手机app下载官网
“这很midjourney。”一位aigc领域创业者说,它的风格就是简单、直接、高效,就像他们做产品的思路一样:“所有精力集中在模型上,不做app,也不做网站。”
高中时期的david holz感兴趣的是设计,也做过设计生意。上大学后,他学了与设计几乎不相干的物理和数学。研究生期间,他希望能选择与现实有关的专业,于是读了应用数学专业。之后,他又攻读了流体力学博士。
创业的想法很偶然。“有一次我不知所措,把所有的事情放在一边。所以我搬到了旧金山,创办了leap motion。”david holz曾在接受媒体采访时说。
leap motion成立于2010年,彼时vr、ar行业还未开始火热。两年后,极具极客气质的leap motion控制器诞生。这个看起来像u盘一般大小的盒子尽管看似毫不起眼,但一经展示便立即吸引了大量的关注。
这个控制器内装有多种传感设备,能追踪到小到0.01毫米的动作,当你把手放在它正上方,便可以跟踪十指动作,并借助计算机视觉技术,让你的手部动作投射在虚拟空间中。
这款充满着想象和憧憬的产品推出后,leap motion一炮而红。2013年经过b轮融资之后达到巅峰状态,估值达到3.06亿美元。
彼时,苹果的ar项目还在初期,希望通过收购将优秀的团队和项目整合到自己的项目中。然而理念的差异让苹果吃了闭门羹。这是david holz第一次拒绝苹果。
五年后的2018年,leap motion已没有昔日的名气,但技术实力依然不弱。接到苹果再次邀约之后,双方开始了谈判,但在交易进展到尾声阶段时,收购再一次叫停。
在之后的公开报道中,david holz间接解释了拒绝苹果的原因,他认为苹果已经失去了创造力,甚至直言:“我永远不会为那些家伙工作,他们是魔鬼。”
最终在2019年,david holz以3000万美元将leap motion卖给了竞争对手ultrahaptics。
midjourney是david holz在ai艺术领域探索新机会的产物。
后面的这次创业,david holz没有融资,但靠“刷脸”解决了midjourney算力问题。
据报道,david holz给一个云供应商的负责人发邮件,希望对方提供10000个gpu。很快,midjourney获得了云供应商的支持,原因便是他们了解到david holz,知道他以前的创业经历。
“相比其他同类产品,midjourney的prompt简短,用户门槛低。”一家第三方研究机构在其报告中写到。
midjourney使用起来极为简单,注册discord账号之后,即可进入midjourney频道,随后可以加入公测服务器。使用时,用户只需要输入命令提示符,就可以生成对应的高品质图形。它可以让用户避开复杂的使用技巧,同时可以用算法让机器想象你输入命令的样子。
这也是midjourney能够脱颖而出的地方。凭借简单的prompt,midjourney借助discord社区持续迭代,社区用户将近1500万。
图源:discord
一位midjourney使用者告诉全天候科技,midjourney给人的感觉是用起来简单而且无约束,“有一种不可思议的力量和流动,就像一款能让我上瘾的游戏。”
而在前述aigc领域从业者看来,midjourney拥有游戏的所有元素:能够让你想象任何实物的可靠核心圈层,魔咒一般灵巧的指令符,以及基于社区的开放文化。
为何不直接做一个ios拍照应用?而是选择discord用户界面。最初其实是因为midjourney团队是一个远程工作的团队,所以建立了一个机器人。
后来,团队用同样的机器人在 discord 上做了一个用户测试,得到的结果是:用户很喜欢这个实时交流想法,富有想象力的环境。这也让david holz看到了discord体验的神奇之处。
“我们发现人们真的喜欢一起想象,所以我们让midjourney更具社交性。我们有一个巨大的discord社区,用户在这些共享空间中共同想象。”david holz曾在公开采访中表示。
他认为,人们想要一起做事情,如果是在ios平台去做,就必须做自己的社交网络,这非常困难。但相反,如果用户想要自己的社交体验,discord是很好的选择。
作为一款适用于游戏玩家一体化语音和文字聊天软件,discord平台的社交属性也让midjourney抢占了更多的用户心智。“它在discord上更像是一个艺术ai的社交空间,能够让它易于迭代、学习、发现和发展。”上述aigc领域从业者说。
换言之,discord社区生态帮助了midjourney的推广。反过来,庞大的用户能够根据自身需求针对性地训练模型并快速迭代产品。
作为ai绘画领域的两个“领头羊”,人们总会把midjourney和stable diffusion放在一起对比。
对比而言,stable diffusio是一个免费开源的模型,完全免费、不限次数、任何人都可用的。因而,stable diffusion的优势在于其无需任何成本即可使用。
同时还可以在github上找到完整的源代码和文档。另外,开源前提下,模型代码迭代的速度也增快,优化效率高于闭源模型。
但缺点也显而易见:如果没有其它护城河,商业化问题难以解决,很容易成为别人前进的垫脚石。
而midjourney则需要付费使用。和大部分软件类应用类似,midjourney采用付费订阅的模式,按月向用户收取费用,共有3种收费套餐:10美元/月、30美元/月、60美元/月。
图源:midjourney凯发k8国际手机app下载官网
相较而言,收费模式容易劝退用户,在社区支持和维护方面也逊于开源的stable diffusion。
然而,相对封闭也成为midjourney构建自身护城河的重要方式。因为没有公开其源代码,因此无法被广泛地研究、改进和应用,midjourney积累的数据集具有独家性,可以进行针对性训练。
midjourney的成功或许包含了多种因素,比如:清晰的目标定位,快速在一个仍然混沌的市场中找到合适的产品形态;专注在有价值的具体业务方面,迅速形成技术优势;找到一个有充沛流量的场景discord,实现低成本获客,低成本营销等。
想象力的空间已经打开,aigc的竞争越加激烈,midjourney 还能赢在未来吗?