博客首页|TW首页| 同事录|业界社区
2008-05-30

昨天有人看我博客后问我:让用户输入图象来搜索太远离用户习惯了,你们的图象搜索让用户输入什么呢?我说,当然是文本了,不同的是输出的结果,现在输入一个物品名称可能出来一个和物品完全无关的明星脸,只是因为明星图象所在网页有这个物品名称。而我的搜索引擎,用户同样输入文本,但因为我的图象引擎是基于图象搜索的,是根据图象搜索的情况反向添加文本标签的,所以不会出来和用户目的无关的结果。
  分解一下是这样:
  1.收集大量规范素材(比如店主实拍的商品图片,图象尺寸大达几兆,物品更清晰,且被嵌入网页上有较格式化的描述信息);
  2.雇大量人工对素材进行清洗整理(做模式识别的都知道这是不可缺少的步骤哈);
  3.使用统计分析的方法训练引擎,使引擎健康成长;
  4.爬虫到处去取图片,使用实验室训练出来的引擎对图片进行分类标签;
  5.将引擎无法识别的图片使用人工进行标签;
  6.将人工标签后的图片再送给引擎,训练引擎。
  经过这样的循环,使引擎不断成长,把网络图片世界连接起来。
  这样的引擎训练好以后,用户不仅可以输入文本查询,还可以输入图片查询,比如我看到一个很眼熟的面孔,我直接鼠标拷贝图片网址,把网址粘贴到搜索引擎里,就出现该面孔挂钩的其他信息,而且用户为了方便,会主动把我的服务装到他的右键菜单里,这样,直接右键菜单上就可以执行图象搜索,搜和那张面孔有关的视频什么的,是不是很酷呢?所以说输入图象搜索离用户习惯远是不正确的说法,用户习惯是你强加给他的,有更简单的方法,而且能为用户带来方便和好处,用户会欣然接纳的。
  昨天那人又说:你们不会有足够的钱做这件事的。
  真的吗?不过那人连模式识别都没听说过,我很同情他,所以,就不和他计较了。
  做这件事,最贵的是人工,模式识别专家团队,素材清洗整理,不能识别的图象进行人工标签,这些,都是很花钱的,至于一般人认为的服务器和带宽费用,在这个项目里倒是毛毛雨了,300T的素材(网店商品图片),200T的无效图象(加起来500T,但是是随时间增长的,而硬件价格下降很快),三年的带宽费用,加起来不会超过800万,加客服工资什么的也不会超过1000万,等于每年要收入400万到500万(含运营费用),这还是支持得起的,关键还是研发的人工费用太高了,最好是有什么基金支持一哈,这么酷的项目……
  目前google的图象搜索量大约占总搜索量10%以上,而我的搜索,将来是要让用户直接右键菜单里搜,比如看到一个手机,直接右键菜单搜这个图象,连一些信息不规范的网页(比如店主用了很多夸张词的商品页面)也可以被搜到,而且给我分门别类,那些是经销商信息哪些是资讯等,不比文本关键字搜图象方便啊?而且更具商用价值,不比google的图象搜索强?
  现在我已经开始商品图片的素材收集了,做了一个免费的商品图片站(ppseek.com)鼓励店主存实拍大图,估计过段时间服务器和带宽会有些吃紧,有没这方面资源可以共享一哈哈?我们可以共享图象识别引擎研究成果的。

2008-05-29

我最近做了一个专为店主服务的免费图片站ppseek.com,有人感到不解:别人都收费,你为什么免费?你靠什么支持网站运营?
  没错,店主使用在网店的商品图片,现在到处被驱逐,yupoo从六月一日起停止对外链到网店的图片提供免费支持了,而有些号称免费的图片站比如886.cn,免费的外链图片带logo,实际上是把免费的外链图片当他们的宣传载体,几乎没有对外链到网店的图片提供真正免费支持的,我ppseek.com为什么要做?
  我ppseek.com现在的做法是,无限空间,不限流量,专为商品图片服务,可以批量上传,单张支持到5M,外链图片不加水印,原图可以选择加水印保护而且是渐变字体水印(希望不易被移除,以后会换更不易被移除的比如彩虹字体的),总之就是鼓励店主上传商品实拍图片,增加买家对卖家的信任度。以后还会增加3D相册的html代码生成功能,也是免费的。凡图片存储、传输、展示方面的服务,都是免费的,尊重用户,绝对不会号称免费而偷偷加水印。
  可是,我为什么要这样做?我当时的解释是:收费有什么好的?结算成本高,落口袋里没多少,如果服务不稳定还会很招骂。
  那位问话的朋友现在用的886.cn的服务,已经存了一万多张照片,他是VIP商务会员,一年交60块钱那种,他对886.cn就有很大怨言,经常红叉叉,而且客服不是24小时,如果换了免费的服务商,他还会那么大意见么?
  而且我对886.cn的服务始终心存疑虑的,886.cn只要是VIP商务客户就享受一样服务,中小网站论坛可以把886.cn的客户端运行到服务器上,然后网站和论坛图片都使用886.cn的无限空间(号称无限),那么,单用户需求量小很多的店主利益怎么保证?这和保险不一样,保险虽然也是客户一样交费享受利益不同,但客户都希望自己是不出险的那个,而网络服务,则所有客户都会希望自己是占用资源最多的那个,在这方面,有技术资源的小网站肯定是比个人店主占很多便宜的,资源被小网站抢去了,交了钱的店主利益如何保证?
  那个朋友存一万多张图片,按一张图片3M计算(这两天上传到ppseek.com的大部分商品实拍图片都差不多这尺寸),就是30G,30G的网络流量多少钱?如果一年内平均下载次数为3(网店商品图片下载次数平均在10以内),那么就是100G左右,光流量费多少钱?再加上存储和服务的开销,886.cn赚什么?如果说886.cn还有赚头,那么,有多少活跃度低的网店店主利益被损害?
  正因为我觉得这样的模式对于网店店主来说不公平,所以,我要做免费的商品图片站,邮箱服务可以免费,图片存储当然也可以免费!
  至于说怎么赚钱,因为商品图片比娱乐图片的描述信息更丰富(可以反向提取商品描述信息而且都是很规范的不象新闻图片那样无逻辑),做个基于图象的图片搜索引擎比使用一般素材要容易多了。现在做的基于图象的图片搜索,都是对轮廓线进行对比,很少有人做基于材质的,这是因为他们能拿到的图片精度不够,而我的ppseek.com提供5M上限的图片存储服务,就是希望从图象上能得到更丰富的材质信息。而且这样的研究,与商品图片展示平台比如电子商务平台,并不发生业务冲突,我还会提供很好的有助于展示的辅助功能比如3d相册的html代码生成功能来帮助电子商务平台的客户——店主。
  至于钱钱嘛,能收点广告费就收点,收不到就只当是图象搜索引擎的研发费用了。
  嗯,现在ppseek.com首页相册广告位免费送呢,有需要的店主,可以来看看。

2008-05-28


累得失语了。


ppseek box差不多了,可以在随便哪个相册(不管这个相册被嵌入哪个页面)完成注册、登陆、创建相册、取相册代码的操作,不用到ppseek本站,不过删除相册(也可以在box里逐张把相册删空,那个相册就被删除了,不过这办法太慢)和管理消息还是需要到ppseek,这两功能应该不是用户常用功能。等于是做了一个80%功能(包括上传照片!)都能在站外实现的产品。我好累啊!有帅哥么?陪我聊会儿天吧!



ppseek是一个免费、不限空间、不限外链流量的商品图片存储网站,致力于为店主提供免费而实用的图片存储及代码分享。


ppseek网址www.ppseek.com。


店主在ppseek可以批量上传图片,单张尺寸不超过5M就可以。可以选择是否保留原图及水印保护原图。所有注册用户自动获得形如userid.ppseek.com的空间二级域名。


ppseek的好处:


1.所有图片上传过程自动压缩到640象素尺寸,这是最适合网店的尺寸,可以轻松嵌入各类网店商品页面而不会导致页面变形。


2.支持单张5M以内的大图,可以批量添加水印防盗,而且水印是渐变字体,不容易被移除。买家可以对比商品页面的外链图片(640的,无水印,美观)和图片信息页的原图(有水印保护的),确定图片是否卖家实拍。


3.列出卖家使用过的设备品牌及型号、拍摄时间及参数,让买家更放心(如果一个卖家使用上十种设备拍摄,则可能有盗用的图片)。


4.html分享功能,有漂亮的跑马灯动画(动画经过测试,支持淘宝),而且支持更换背景,还可以把所需要的自定义背景图片先上传到ppseek上再设置为背景。以后还会不断推出新的html分享样式。


5.3D相册功能,移动鼠标显示细节,比如显示衬衫袖扣、针脚等,现在的flash版的3D相册支持显示160尺寸,以后html版的3D相册显示细节图片打算做到320,会更适合一些。


6.二级域名及推广功能,所有注册用户自动获得二级域名,flash相册可以自定义链接(比如放上自己的淘宝店址),嵌入博客或论坛页面可引导你文章及贴子读者去看你的网店。


如果是店主,希望最快速度拿图片地址或代码,可以走快速流程:


直接由相册上的ppseek box或者顶部浮动菜单注册(完成注册自动登陆)或登陆:


注册或登陆


上传图片(支持ctrl或shift批量上传),传完直接点底部的预览或顶部的分享按钮,前往预览界面:


上传图片


在预览界面拉动滚动条选照片然后点底部的图片信息按钮即可到图片信息页取图片地址。


也可以点html分享按钮前往html效果查看及取代码。


预览


上图中,如果希望更换相册外观,则点击换肤,如果希望创建三维相册,需要两张以上照片,其中第一张是全局照片,其他是细节照片。


在html分享页面可以先更换背景及字色,再复制html代码。由于html分享代码中包含原图信息,可以给买家更丰富的图片信息让商品获得信任。


html分享


如果将相册用于博客宣传,则需要在编辑栏中进行照片顺序调整、备忘信息的添加,以及自定义链接的添加(都很简单,按界面提示操作即可)。

2008-05-08


国际大米价格触摸1000美元/吨的高价了。


 


当我在超市看到挂面已经3.35元/400克时,如果不是力气小,真想买一大包米回来,免得再过一段时间连米都吃不起了。


 


刚搜资料看到,美国今年要花1.14亿吨粮食造生物燃料(http://news.xinhuanet.com/fortune/2008-05/05/content_8106966.htm),注意文中这一句话“世界银行一份报告称,给一辆SUV的油箱加满生物燃料所需的粮食大约相当于一个人一年的口粮。”


 


据说2010年全球汽车保有量将突破10亿辆,按每辆车每年一万公里,百公里油耗8升计算,需要8000亿升,相当于100亿个SUV油箱容量,如果石油枯竭后真的拿粮食转化燃料,全球人不吃饭也不够用的。何况不仅汽车需要燃料,飞机什么的也需要啊。


 


美国人,别瞎折腾了,地球粮食全用来生产燃料酒精也不够的,还是想想其他招吧。


 


目前我国的石油开采期按照探明可开采量和年消耗量来看只有11年,而中东地区有40年,中东地区储量占全球大头,就算全球综合还能用35年,到不了2050年就要枯竭,怎么办?


 


以前算过一个帐,按目前的各环节转化效率,使用生物能源,转化为电能时对太阳能的利用效率只有9%(指速生灌木全株用于火力发电,淀粉转化酒精更低),如果转化为车用燃料,效率还更低,使用太阳能电池,效率现在已经超过20%了。


 


有段时间有个朋友老和我聊这方面问题,能源出路何在?我们讨论了煤电、水电、核电、太阳能、生物质能等多种能源,目前来说,技术成熟又在未来一段时间可能顶上的,只能寄希望于核电了(太阳能电池每平方米每年只能产200度电,一座核电站占地面积10平方公里,年发电可以达到100亿度,每平米年产出达到1000度)。按百公里30度电、中国达到一亿辆车,每辆车一年跑一万公里计算,一年需要3000亿度电,30座核电站就够了。据说新批了40座核电站的建设,但核电站建设也有一个问题,建设周期长(将近五年),成本高(每座核电站投资百亿),占地面积也不小(每平方米电力产出仅为太阳能五倍)。


 


如果产出不能很好提升,那么,消耗能否降低?又是夏季了,我在开空调的季节比不开空调的季节要多费三倍的电,而且这还是我用电炊、电热水器的情况下,空调耗电量之大可见一斑。有没有效率好一些,能耗低一些的室温调节办法?不止是空调,实际上,很多电器都存在这样的问题,目前中国的人均电器使用水平还很低,如果达到美国的水平,能耗会涨多少?有次去一个朋友家玩,她老公听我们聊耗电情况,指头顶的吸顶灯计算,七个头的一盏吸顶灯,用的磨砂玻璃壳,只装了四只灯泡,每只一百瓦,而在小时候这样的房间一般装一支40瓦的日光灯就够了,很多人嫌冷光灯(日光灯及各种节能灯)不好看,装白炽灯再加壳,而且随着空调等大功率电器用的越来越多(比如一户用三、四台空调或用小型中央空调),照明耗电的增加基本就被居民忽略了。


 


有没什么办法引导一下让人都注意节能一些?起码在不改变生活品质的情况下,能否节能一些呢?


 


另外,食物的危机,今年是因为能源危机暴露出来的,即使没有能源危机,如果不开拓新的食物来源,以后也会暴露。比如说:为什么海洋养鱼还是用饲料养鱼,而不是种海藻养鱼?如果改为种海藻养鱼,现在是不是就得开始研究方法?

2008-05-06

昨天billy发给我消息:


2008年5月5日凌晨,Yupoo相册发布几项迄今为止最为重要的更新:


一、VIP服务正式推出。


二、将于2008.6.1,停止对taobao, paipai, ebay(eachnet)等电子商务类站点的免费支持。


三、贴片广告试运行。


 


去又拍网站上看,果然看到此公告(http://blog.yupoo.com/?p=240)。


 


今天早上小蛇跟我贴子说:财大气粗的myspace也不敢让taobao的店主们外链图片了。。。你看中国雅虎和taobao还是兄弟单位呢,都不让taobao链,哈哈


 


记得原来免费邮件也是抠抠索索有这样那样的限制,结果某巨头推出上G容量的免费邮件服务后,世界一下清静了。但是,图片外链,连有的巨头收购的公司都是以此作为重要收入来源,谁会来当打破规则的人? web mail可以作为广告载体,而且虽然宣称支持多大容量,但用户平均使用率其实是很低的,图片外链支持则完全不同,怎么打破规则?再小声问一句,那些提供大容量免费邮件的厂商,邮件服务都赚钱了么?

2008-05-05

昨天,我看到我博客访客里有个叫王悦欣的漂亮妞,于是点过去看,还把地址复制到群里,让别人看我发现了一个漂亮妞,有人看后说,这不是盗的景甜的照片么?
  嗯,大家可以对比一下,那个盗照片的博客地址:http://blog.sina.com.cn/jxl1230
  景甜的博客(http://blog.sina.com.cn/jingtian)里穿同一件衣服博文地址:http://blog.sina.com.cn/s/blog_4bb7eaf901000bdp.html
  仔细看王悦欣博客,发现不仅盗用照片,而且堆砌热门关键字,毫无疑问属于博客营销。
  那么,访问我博客的也就不是什么美人,甚至不是真人,而是机器人模拟的访问!5555,我太伤心了,本来还以为自己的粉丝阵营里又多一名美女呢!
  分析了一下王欣悦博客,照片很漂亮,自称是外科护理专业毕业后在甘肃某家还不错的医院工作,84年出生,而且期望结交朋友可以一起旅游(希望对方有点小钱)。对男性来说,这是非常有诱惑力的:
  1.漂亮但不是年轻得过分(有的男性对太年轻的姑娘没兴趣或觉得不好下手,喜欢有点阅历的);
  2.制服!外科护理专业毕业后在医院工作,护士?
  3.有交友意愿,而且希望对方有点小钱……这一条,对有钱无脑的小款杀伤力很大哦。
  问题是,你为什么要偷景田的图片呢?据说景甜现在是中戏最红的学生,盗用曝光率那么高的明星照片,很容易穿帮的!想起以前同事的话,盗也得去台湾网站盗中学生照片啊,那样穿帮机会才少嘛,怎么可以盗明星的照片呢?
  关键是,我竟然还真以为网上有未被发现的美女呢,还把链接推荐到群里,太丢人了,我是群主啊!5555,不活了,这就找块豆腐撞去。

到目前为止,网络广告还是以文字广告和图片广告(包括简单动画)为主,与背景融合越好的广告越容易被用户接纳,在网络内容以文字内容为主的情况下,这样的广告无疑是正确的。但是,文字内容的阅读其实是比较累人的,上面投放的广告一般也是比较需要理解的,这类广告不适合同质化较强,以品牌宣传的一些广告,比如快速消费品等。有些广告在上面投放效果非常好,尤其以功能阐述为主的一些广告。这也是目前大企业品牌广告在网络的投放量不如中小企业的一些产品广告的原因。
  有人在网吧能看到七成用户连浏览器都不打开的现象(看电影、玩游戏、聊QQ),有人将之归咎于用户不愿付出学习成本,可是,上网真的很困难吗?学习成本真的很高吗?关键还是在于web上没有足够有吸引力的东西吧?
  随着硬件和带宽费用的降低,网络富媒体内容传播越来越容易,以富媒体内容为载体的广告也会越来越多,本着与背景融合的原则,广告也应采取富媒体形式。
  富媒体形式的广告,比文字和简单动画广告优势在于穿透力强,更具有强制性,对于不以功能为诉求的品牌宣传,是比较合适的。
  现在富媒体内容上承载的广告,还是比较羞涩,没有象传统媒体那样强行插入,即使与内容同屏,也只是做了底部广告,而且多半是无声的,简单的文字或图片广告,比传统广告穿透力差很多。
  目前网络富媒体内容和用户都爆发增长阶段,相应的,广告也要跟上,而且在用户量不是太大的情况下(相对传统电视媒体),正好实验各种形式广告哪种效果最好。
  富媒体广告相对传统的网络广告,将具备以下特征:
  1.交互少,不需要用户操作,以单向灌输为主;
  2.更具备强制性,在富媒体内容上强行插入或不定位置出现文字;
  3.信息量小,容易被用户记住。
  由于富媒体广告主要目的在于品牌宣传,因此对投放量会有一个起点的要求,如果达不到投放量,广告主就没有精力来做这样的投放,所以富媒体内容在今后一段时间里,主要任务还是上发行量,只有占领了足够的眼球,才能打动这个领域的广告主。当然,回报也会比传统的网络广告要丰厚。