本篇文章1847字,读完约5分钟
免费股票/ flickr
Pinterest的每月活跃用户达到1亿,它越来越依赖机器学习来帮助发现新的互联网见解。
全世界的用户都可以访问pinterest来浏览、保存和共享照片和文章。帮助用户找到他们喜欢的内容,用户自然会被保留:30%的pinterest互动和25%的pinterest购买来自pinterest推荐的相关内容。为了推荐合适的内容,pinterest使用了数据驱动的顶级技术,并进行了大量实验。
那么,pinterest是如何通过机器学习实现的呢?
pinterest的首席发现科学工程师Mohammad Shahangian说:“我的主要工作是找到解决内容发现问题的方向。”我们将对算法进行非常小的改动,每一次尝试都有它的优点或缺点。”
独家优势:基于兴趣
街道
事实上,这与pinterset的特点有关:pinterset的优势之一是它是一个围绕用户兴趣建立的社区,用户可以根据自己的兴趣对他们在互联网上找到的产品、文章和图片进行分类。这意味着pinterest不必像其他社交网站那样通过点击模式或在页面上花费的时间来猜测用户的兴趣,而是可以用算法直接测量其数据库中750亿个条目之间的关系,因为这些条目可能属于相同的兴趣。
Mohammad shahangian说:“许多公司试图通过输入或信号来推断用户的兴趣。但是在pinterest中,用户清楚地给出了他们感兴趣的信号。"
访问pinterest的用户不断地为这个由用户、收藏物品和收藏板组成的社交图片做出贡献。这些数据可以使pinterest更准确地为用户主页信息流、搜索结果和相关内容推荐提供内容。仅仅根据用户关注的内容向他们推荐并不理想,而且重复类似的内容也很容易。
在mohammad shahangian看来,“如果你已经收集了厨房水槽的条目,我们应该为你推荐更多的水槽,还是应该推荐一个可以让你的厨房看起来焕然一新的条目?”
在实践中保持测试
为了做出这些决定,pinterest的工程师们试验了各种机器学习算法。他们研究了这些算法对相关和不相关项目的影响,以及它们如何影响真实用户的活动。
Mohammad shahangian说:“我们将直接在pinterest上做实验,但很多时候我们会在实验前做很多准备工作。”
当然,如果没有实际测试,就无法知道某个用户是否会喜欢新推荐的内容。mohammad shahangian说:“我不能要求某人告诉我某个用户是否会喜欢新推荐的内容。”但是通过研究算法推荐的内容是否会被真实用户归类为某种兴趣,我们可以得到一个相对可靠的答案。
此前,pinterest将用户主页的消息流从单纯的按照时间来排列与用户相关的消息改为算法生成的消息流,这使得用户的活动增加了五分之一到十分之一,后续算法的改进将带来额外的改进。
Shahangian说:“pinterest在整个改进过程中取得了巨大的进步。”个性化极大地改善了用户活动。”
改进图像搜索功能
Pinterest一直在改进图像搜索,以帮助用户更好地找到相似的图像。Pinterest工程师与加州大学伯克利分校视觉和研究中心的研究人员合作开发了这项技术。现在它可以通过深度学习算法自动识别图片中的物体。通过这种方式,用户可以点击这些对象来查找pinterest中的相关项目。
pinterest视觉搜索工程师Dmitry kislyuk说:“这不是一个区分猫和狗的分类算法。”我们希望实时发现图片之间的相似之处。”
他说,这种视觉搜索工具在pinterest中发现家居装饰品和时尚物品非常有效。未来,pinterest希望改进其自动分类功能,以更好地满足其他搜索需求,例如帮助用户找到类似的新食谱。
当谈到使用深度学习来更有效地对图像进行分类时,pinterest视觉搜索工程师andrew翟说:“我认为我们的模型将变得更加语义化和更好。”
虽然pinterest的工程师们正专注于改进对象识别和搜索,但他们也计划开发一款应用程序,让智能手机用户能够拍摄真实世界的对象,然后在pinterest上获得相关的商品推荐。
迪米特里·基斯柳克说:“如今,深度学习和计算机视觉领域令人兴奋。世界变化太快,尖端技术每两个月就会发生变化。”
viafastcompany
推荐阅读:
Pinterest完成了G轮融资,融资总额为5.53亿美元,低于预期
创造苹果mac经典外观的设计师将加入pinterest,负责产品设计