麻花传沈娜娜mv免费观看,自述被啪的最爽的一次,久久久久亚洲精品,香蒸焦蕉伊在线,国产网战无遮挡

為什么大數據在預測《黃金時代》票房時不靈了?

2014-10-22 項目

展(zhan)示量: 3812
為什么大數據在預測《黃金時代》票房時不靈了?

截(jie)止到10月16日,《黃金(jin)(jin)時代》的(de)累計票房為4698萬(wan)(已上映16天),如此(ci)成(cheng)績對于片方、媒體和公眾而言都是出乎意料,畢竟滿(man)滿(man)的(de)七天國慶黃金(jin)(jin)檔(dang)是一個日產(chan)(chan)斗金(jin)(jin)的(de)高(gao)產(chan)(chan)值檔(dang)期,無論(lun)是湯(tang)唯(wei)還是馮紹峰(feng)都已是炙手可熱的(de)有極高(gao)票房號召力的(de)大明星(《北京遇上西雅(ya)圖》《后會無期》票房均超過(guo)5億),此(ci)役失利堪稱冷門。


但(dan)最令人啞然的(de)(de)恐怕還(huan)是(shi)影(ying)片上(shang)映前百度為(wei)(wei)其(qi)背書的(de)(de)票房預(yu)(yu)測(ce)(ce),當時很(hen)多媒體還(huan)認(ren)為(wei)(wei)百度的(de)(de)預(yu)(yu)測(ce)(ce)太(tai)過保(bao)守(shou)(shou)。在(zai)百度百發的(de)(de)新聞發布會上(shang),當宣布預(yu)(yu)測(ce)(ce)票房為(wei)(wei)2.0~2.3億(yi)后,全場只有(you)安靜,畢竟(jing)對于(yu)這個為(wei)(wei)期七天(tian)的(de)(de)黃金(jin)檔期對于(yu)擁有(you)湯(tang)唯和馮紹峰的(de)(de)電影(ying)而言,只預(yu)(yu)計這個數(shu)字略顯(xian)保(bao)守(shou)(shou)了——但(dan)如此謹(jin)慎的(de)(de)預(yu)(yu)測(ce)(ce),在(zai)今天(tian)看來竟(jing)顯(xian)得過于(yu)“樂(le)觀”。


其(qi)實百度很早就開始(shi)研究并在內部(bu)測試票房(fang)預(yu)(yu)測了,在今年7月(yue)18日(ri)愛奇(qi)藝影(ying)業(ye)宣布成(cheng)(cheng)立的(de)(de)(de)新聞發(fa)布會上,愛奇(qi)藝首席內容官馬(ma)東就曾(ceng)透(tou)露,目(mu)前在愛奇(qi)藝內部(bu),基于百度大數據(ju)的(de)(de)(de)票房(fang)預(yu)(yu)測已經能夠做到80%以上的(de)(de)(de)準(zhun)確(que)率,未來將會在適當(dang)的(de)(de)(de)時候對外發(fa)布票房(fang)預(yu)(yu)測。顯(xian)然,針對《黃金時代》的(de)(de)(de)百度百發(fa)(娛樂眾籌產品)發(fa)布就成(cheng)(cheng)為了百度票房(fang)預(yu)(yu)測發(fa)布的(de)(de)(de)適當(dang)時候,但只可惜出(chu)師(shi)未捷。


為什(shen)么中國最有能(neng)力做大(da)(da)數據預測的百度,竟會“意外”馬失前蹄?創投分享會君(jun)為此(ci)采訪了愛夢娛樂大(da)(da)數據創始人雷鳴(ming)、樂視影(ying)業(ye)數據及(ji)策略中心(xin)總監凌(ling)毅、凡(fan)影(ying)調研客戶總監王舒及(ji)搜(sou)狗搜(sou)索事業(ye)部。


(創投(tou)分享會(hui)注:搜(sou)狗搜(sou)索事業部——“深思”是(shi)搜(sou)狗搜(sou)索正在(zai)嘗試(shi)做的一(yi)個(ge)社會(hui)化(hua)預(yu)(yu)測(ce)系統,據(ju)搜(sou)狗方(fang)面介紹,命(ming)名為(wei)“深思”,是(shi)希望在(zai)不同領(ling)域進(jin)(jin)行趨勢預(yu)(yu)測(ce),通過這(zhe)個(ge)綜合(he)系統來發(fa)現隱藏在(zai)大數據(ju)背后的奧秘(mi),而電(dian)影票房這(zhe)一(yi)方(fang)向的預(yu)(yu)測(ce)是(shi)“深思”最(zui)先進(jin)(jin)行探索的領(ling)域。)


歷史沉淀數據嚴重不足


雷鳴和(he)王舒都認為,在國內做電影票房預測存在一個根本性的(de)“疏漏(lou)”,就是中國電影市場(chang)的(de)歷(li)史數(shu)據沉淀嚴重(zhong)不足。我(wo)國有(you)詳(xiang)細、清楚(chu)和(he)準確的(de)票房記錄是從2012年開始(shi)。


當年2月(yue),全國(guo)電(dian)影票務綜合信(xin)息系統(簡稱新平臺(tai))上線。該(gai)平臺(tai)共(gong)規劃(hua)了信(xin)息速遞、行(xing)業組(zu)織管(guan)理(li)、影院管(guan)理(li)、影片管(guan)理(li)、票房數據(ju)接收(shou)、放映(ying)數據(ju)接收(shou)、監控(kong)管(guan)理(li)、專資(zi)收(shou)繳管(guan)理(li)、專資(zi)使用管(guan)理(li)、查(cha)詢統計、分析預測、GIS綜合展示、安全認證、系統管(guan)理(li)、SSL應用共(gong)15個模塊,77項功能(neng)。從技術上才實現了能(neng)夠準(zhun)確統計全國(guo)的票房、場次、排片等影院端生成的數據(ju)。


在此(ci)之前,除了年底由國家電影專(zhuan)資辦統計(ji)出具的(de)(de)權威票(piao)房數據(ju)(ju)外,其他每周、每月票(piao)房的(de)(de)數據(ju)(ju)多是由專(zhuan)業人士根據(ju)(ju)抽樣樣本的(de)(de)統計(ji)進行的(de)(de)估算。


雷鳴和(he)王舒都提(ti)到了,好萊塢(wu)從(cong)1930年代前后即開始進行(xing)票(piao)房(fang)數據(ju)(ju)的(de)調查、統(tong)計和(he)披(pi)露。創投(tou)分享(xiang)會君(jun)查到可能是好萊塢(wu)最早(zao)的(de)票(piao)房(fang)數據(ju)(ju)調研公(gong)司之一的(de)QUIGLEY出版(ban)(ban)公(gong)司(QUIGLEY PUBLISHING COMPANY, INC.),該公(gong)司創立于1915年。根(gen)據(ju)(ju)其官網介(jie)紹,該公(gong)司每年向公(gong)眾出版(ban)(ban)《全球電影(ying)票(piao)房(fang)年鑒》( Internationl Motion Picture Almanac),年鑒內(nei)包含電影(ying)公(gong)司的(de)信息、當年出品電影(ying)片目、票(piao)房(fang)統(tong)計數字、獲獎情況等電影(ying)行(xing)業的(de)制片、發行(xing)及放映方(fang)面的(de)統(tong)計資料。


由(you)于包括QUIGLEY公司(si)在內的(de)第三方(fang)調研公司(si)經年累月的(de)數(shu)據(ju)統(tong)(tong)計,好萊塢能夠在近百年的(de)時間里積累了(le)大量的(de)歷史統(tong)(tong)計數(shu)據(ju),這些數(shu)據(ju)的(de)沉淀并經過當代計算機數(shu)字(zi)技術的(de)結構化(hua)才形成了(le)如今好萊塢電(dian)影(ying)大數(shu)據(ju)預測的(de)基礎。


搜(sou)狗方(fang)面(mian)坦言,他(ta)們(men)并(bing)未對《黃(huang)金時代》進行(xing)票房預測,問及百度的(de)失利原因,他(ta)們(men)認為(wei),“就票房預測本身而言,這是(shi)一件很(hen)復雜困難(nan)的(de)事(shi)情,所以預測不準確這件事(shi)情是(shi)很(hen)正常的(de)。”搜(sou)狗方(fang)面(mian)也重(zhong)點提到了(le)關(guan)于歷(li)(li)史(shi)數(shu)(shu)據(ju)不足量(liang)(liang)是(shi)目前做(zuo)大數(shu)(shu)據(ju)預測的(de)重(zhong)要(yao)困難(nan),“票房預測模型較為(wei)依賴歷(li)(li)史(shi)數(shu)(shu)據(ju),但通(tong)過歷(li)(li)史(shi)數(shu)(shu)據(ju)積累學習(xi)(xi)比較難(nan),(我國)有(you)數(shu)(shu)據(ju)可(ke)查的(de)片子(zi)數(shu)(shu)量(liang)(liang)也只有(you)數(shu)(shu)百部,可(ke)用來(lai)學習(xi)(xi)規律的(de)歷(li)(li)史(shi)數(shu)(shu)據(ju)積累其實十分(fen)有(you)限。”


雷鳴介紹,愛夢娛樂大數(shu)據(ju)為(wei)了(le)彌補公開的(de)票(piao)房數(shu)據(ju)資(zi)料不足(zu),自己做(zuo)了(le)大量(liang)(liang)的(de)“臟(zang)活、累活”,對2010年(nian)以來(lai)的(de)國產影片單片的(de)投資(zi)額、票(piao)房、演員(yuan)陣(zhen)容等進行(xing)(xing)了(le)盡可能的(de)資(zi)料發現和統計,并進行(xing)(xing)了(le)標簽化(hua)的(de)整理,從而形成自己的(de)具備一定沉淀量(liang)(liang)的(de)結構化(hua)數(shu)據(ju)。


王舒還特別提到(dao)了(le),從2012年有詳盡票房統計(ji)以(yi)(yi)來的統計(ji)數據并不足夠有參考價值(zhi)以(yi)(yi)作為(wei)票房預測的基礎,因為(wei)中國電影產(chan)業自2012年以(yi)(yi)來連(lian)續地進入了(le)一段(duan)爆(bao)發式的增(zeng)長期,從百(bai)億迅速跨越(yue)到(dao)了(le)兩(liang)百(bai)億元(yuan),甚至今年有望沖擊300億元(yuan)。


“穩(wen)定性(xing)是(shi)做趨(qu)(qu)勢(shi)性(xing)預測的基礎。”王(wang)舒認為,“高速增(zeng)長是(shi)破壞性(xing)的,如果根據這樣的數據進行預測,則必(bi)須做出實時的調整才能相對準(zhun)確。”就王(wang)舒看(kan)來,只有(you)等到中國電影(ying)的票房產值(zhi)進入到一(yi)個穩(wen)定的平臺期(qi),電影(ying)的消費習慣(guan)趨(qu)(qu)于穩(wen)定,趨(qu)(qu)勢(shi)性(xing)的預測才可能基于統計分析“準(zhun)確”做出。


難以排除的數據“噪音”——“臟數據”


根據(ju)(ju)媒體對(dui)當時百度(du)百發推出時的(de)報道顯(xian)示,“據(ju)(ju)百度(du)大(da)數據(ju)(ju)部產品(pin)規劃負(fu)責人祖崢介紹,百度(du)票(piao)房預(yu)測基于百度(du)每日60億次(ci)的(de)搜索查詢(xun)數據(ju)(ju),1億規模(mo)的(de)微(wei)博數據(ju)(ju)以及10年(nian)電(dian)影行業數據(ju)(ju),通過百度(du)大(da)數據(ju)(ju)引擎將數據(ju)(ju)進行整合、建(jian)模(mo)和清洗,輸出針對(dui)特定電(dian)影的(de)搜索指數、社交指數、演員指數、導演指數等(deng),最(zui)終可(ke)以導出電(dian)影總票(piao)房預(yu)測和7日票(piao)房預(yu)測等(deng)數據(ju)(ju)。”


雷鳴認為(wei),百度的(de)(de)搜(sou)(sou)索(suo)排名以及(ji)搜(sou)(sou)索(suo)結果導(dao)出的(de)(de)各類指(zhi)數都會有大量的(de)(de)“結果”來自于片方及(ji)其宣傳公(gong)司的(de)(de)購買,即非自然形成的(de)(de)人為(wei)推高——這(zhe)在(zai)電影行業的(de)(de)宣傳里司空(kong)見慣,當然也(ye)是百度的(de)(de)競價排名等(deng)與搜(sou)(sou)索(suo)結果有關(guan)的(de)(de)收費服務(wu)所提供的(de)(de)“宣傳空(kong)間”。


如果(guo)是這些“結果(guo)”,則(ze)本身由此就會存(cun)在(zai)大量的誤(wu)導,這在(zai)雷(lei)鳴的描述里被稱作統計(ji)上的“噪音”,亦(yi)被稱作“臟(zang)數據(ju)”。雷(lei)鳴認為(wei)(wei),不(bu)排除(chu)《黃(huang)金時代》存(cun)在(zai)這些“噪音”,而百度方面很(hen)有可能(neng)因為(wei)(wei)沒有能(neng)夠剝離(li)這些“臟(zang)數據(ju)”,從而“被自己(ji)欺騙了”。


百度方面是否(fou)有能力清(qing)理這些“臟數(shu)(shu)據(ju)”以便讓數(shu)(shu)據(ju)更真實,讓基于這些數(shu)(shu)據(ju)的票(piao)房預(yu)測成(cheng)為靠(kao)譜的趨勢判斷呢?


搜(sou)狗(gou)方面認為(wei)(wei)技術上應(ying)該(gai)是可以的(de)(de),就搜(sou)狗(gou)的(de)(de)“深思”而言,“我們會用(yong)多個來源(yuan)的(de)(de)數(shu)(shu)據(ju)互(hu)相校驗,比如搜(sou)索數(shu)(shu)據(ju)、各(ge)個社(she)交媒(mei)體的(de)(de)數(shu)(shu)據(ju),也會有一(yi)些(xie)過(guo)濾策略,應(ying)該(gai)能夠減少這些(xie)行為(wei)(wei)的(de)(de)影響。”搜(sou)狗(gou)方面也相信,“同為(wei)(wei)搜(sou)索引擎,百(bai)度在整合數(shu)(shu)據(ju)的(de)(de)過(guo)程中(zhong)也會有相應(ying)的(de)(de)過(guo)濾策略。”


但如果這(zhe)些“臟數(shu)據(ju)”成(cheng)為構(gou)成(cheng)指數(shu)的大部(bu)分甚(shen)至是絕大部(bu)分數(shu)據(ju)呢?特別是當一部(bu)偏小眾(zhong)、偏安(an)靜(jing)的文藝(yi)青年所期待的電影,他們本身對于這(zhe)些數(shu)據(ju)的貢獻有限甚(shen)至微弱(ruo)的情況下(xia),一旦洗干凈了數(shu)據(ju)是否會存在可供分析或生成(cheng)指數(shu)的數(shu)據(ju)也就所剩無幾了呢?而這(zhe)些失去統計價值的數(shu)據(ju)是否仍能作為票房預測的依(yi)據(ju)呢?


這種(zhong)矛盾或許也(ye)是百度的票房預測模型和數學家們所困(kun)擾(rao)的吧(ba)。


預測模型還處在初級階段:變量遺漏和樣本偏差


關(guan)于(yu)百度(du)預測模型,媒體公開的資料顯示,“這一產品結合百度(du)搜索數(shu)據、新浪微博數(shu)據,以及中國電(dian)影(ying)過去5年的歷史票房數(shu)據,可以從(cong)演(yan)員熱(re)度(du)、導演(yan)熱(re)度(du)、電(dian)影(ying)關(guan)注度(du)、上映時間等多個維(wei)度(du)對(dui)一部電(dian)影(ying)進行票房預估(gu)。”


凌(ling)(ling)毅(yi)(yi)認(ren)為,僅從(cong)披(pi)露的(de)信(xin)息看(kan),模(mo)型內(nei)(nei)(nei)包(bao)含的(de)數據(ju)維度(du)并不足夠多,“或許該(gai)模(mo)型還處(chu)在初級階段。”凌(ling)(ling)毅(yi)(yi)提(ti)到(dao)了從(cong)媒體(ti)公布的(de)資料看(kan),特別是(shi)忽略了檔(dang)期內(nei)(nei)(nei)其他競(jing)爭(zheng)影片這一(yi)重(zhong)要的(de)參(can)考維度(du)。而據(ju)其分析,該(gai)片之所以(yi)會(hui)票房失利,與影片對國慶檔(dang)期的(de)錯(cuo)判(pan),特別是(shi)該(gai)檔(dang)期內(nei)(nei)(nei)觀(guan)眾的(de)消費心(xin)理錯(cuo)判(pan)有(you)很大的(de)關系。凌(ling)(ling)毅(yi)(yi)介紹,樂視影業內(nei)(nei)(nei)部對于電影項目的(de)數據(ju)決策(ce)模(mo)型中,基于同(tong)檔(dang)期競(jing)爭(zheng)影片的(de)數據(ju)分析是(shi)十分重(zhong)要的(de)數據(ju)維度(du)。


搜狗方面(mian)亦對(dui)(dui)此深為認同,“影(ying)響(xiang)(xiang)票房的(de)未知(zhi)因素(su)多:導演、演員、劇本(ben)、宣傳、首(shou)映時間、影(ying)片檔期、同期競爭的(de)影(ying)片、CPI、經濟周期、天(tian)氣(qi)情況、影(ying)院的(de)排(pai)片率、上座率、票價、是(shi)否3D等等。此外(wai),《黃金時代》與多部電(dian)影(ying)同步上映,互相影(ying)響(xiang)(xiang)。而很多數據都是(shi)基于(yu)(yu)單部電(dian)影(ying),對(dui)(dui)多部電(dian)影(ying)相互影(ying)響(xiang)(xiang)的(de)作用并(bing)不(bu)好分(fen)析預(yu)(yu)判。百(bai)度票房預(yu)(yu)測(ce)基于(yu)(yu)百(bai)度搜索數據、新浪微博數據,以及中國(guo)電(dian)影(ying)過去10年的(de)歷史票房數據,數據的(de)來源和覆蓋人(ren)群還是(shi)非常廣的(de),只(zhi)是(shi)如上所述,預(yu)(yu)測(ce)過程(cheng)中充(chong)滿了不(bu)確定性,特別(bie)是(shi)一些不(bu)可預(yu)(yu)期的(de)變(bian)量會對(dui)(dui)預(yu)(yu)測(ce)結果產生比較大的(de)影(ying)響(xiang)(xiang),這點(dian)在(zai)部分(fen)電(dian)影(ying)中表現會比較明顯,也(ye)是(shi)不(bu)可避免的(de)。”


在(zai)(zai)王舒(shu)看來,變(bian)量(liang)遺漏和樣本偏(pian)差是(shi)(shi)做統計性趨勢分析的(de)(de)最大敵人。前(qian)者即是(shi)(shi)凌毅提到(dao)的(de)(de)問題,維度的(de)(de)不(bu)夠(gou)豐富,不(bu)僅可能是(shi)(shi)因(yin)為疏(shu)漏而導致沒有納入(ru)到(dao)統計口徑內,還(huan)可能是(shi)(shi)因(yin)為互聯網內的(de)(de)數據(ju)目前(qian)仍(reng)然存在(zai)(zai)“門戶”壁(bi)壘——無法(fa)打(da)通(tong)(tong)(tong)一(yi)些關鍵的(de)(de)大數據(ju),譬(pi)如說微博數據(ju)與微信(xin)數據(ju)打(da)通(tong)(tong)(tong),譬(pi)如百度的(de)(de)搜索引(yin)擎內沉淀的(de)(de)數據(ju)與騰訊(xun)在(zai)(zai)QQ、微信(xin)上沉淀的(de)(de)用戶數據(ju)打(da)通(tong)(tong)(tong),譬(pi)如淘寶(bao)、京東、貓眼等電商(shang)或O2O平臺內的(de)(de)數據(ju)之(zhi)間(jian)打(da)通(tong)(tong)(tong),這些具(ju)有強關聯性的(de)(de)數據(ju)目前(qian)還(huan)難以實現數據(ju)的(de)(de)分享,而這些數據(ju)不(bu)能打(da)通(tong)(tong)(tong),則(ze)任何一(yi)方對(dui)于(yu)“人”的(de)(de)消(xiao)費(fei)行為描述、消(xiao)費(fei)心理觀察(cha)都(dou)必然會有相(xiang)當程度的(de)(de)偏(pian)頗,變(bian)量(liang)遺漏也就在(zai)(zai)所難免了。


樣本偏差(cha)指的(de)(de)是,“在沒有嚴(yan)格遵(zun)循(xun)隨機的(de)(de)原則(ze)時,所覆蓋的(de)(de)樣本越大(da)反(fan)而(er)會導致誤差(cha)越大(da)。”另外由于(yu)搜索(suo)只(zhi)是一(yi)種表示興趣(qu)的(de)(de)行為,如(ru)果僅以(yi)一(yi)小(xiao)部分人的(de)(de)興趣(qu)來推測全(quan)體的(de)(de)購票決策(ce),準確度(du)有限是難免(mian)的(de)(de)。


影院經理仍然是迄今為止最好的票房預測專家


雷(lei)鳴在介(jie)紹愛夢娛樂大(da)(da)數據的(de)票房(fang)預(yu)(yu)測(ce)(ce)模(mo)型時(shi),特別強調了(le)行(xing)(xing)業情報對于票房(fang)預(yu)(yu)測(ce)(ce)的(de)不可替代性。雷(lei)鳴認為只(zhi)有基于對于行(xing)(xing)業的(de)深刻理解(jie),再加之(zhi)以大(da)(da)數據才可能做出誤差較小的(de)票房(fang)預(yu)(yu)測(ce)(ce)。雷(lei)鳴方面在此次國慶檔期(qi)的(de)票房(fang)預(yu)(yu)測(ce)(ce)中,對《心(xin)花路放》《痞子(zi)英雄(xiong)2》及《親愛的(de)》的(de)預(yu)(yu)測(ce)(ce)基本準(zhun)確,偏差較小,但也在《黃金時(shi)代》上出現了(le)“較大(da)(da)失誤”。


雷鳴告訴創投分享會君(jun),“沒想(xiang)到影(ying)院(yuan)經理這么快就徹底放(fang)棄了(le)《黃(huang)金(jin)(jin)時代》”,經過復盤(pan)分析(xi)后,發現整個9月(yue)(yue),全(quan)國票房大盤(pan)整體疲軟,到了(le)中下(xia)(xia)旬更是(shi)堪稱蕭條,每日(ri)大盤(pan)經常(chang)出現少于(yu)5000萬(wan)甚至是(shi)兩三(san)千萬(wan)的(de)低迷狀況(kuang)——影(ying)院(yuan)經理們“饑餓”了(le)一(yi)整個月(yue)(yue),在暑期(qi)檔繁榮的(de)背影(ying)下(xia)(xia),九月(yue)(yue)幾乎令(ling)人(ren)哀傷(shang)。正因(yin)為如此,影(ying)院(yuan)經理對于(yu)《心花(hua)路放(fang)》的(de)“暴飲暴食”也(ye)(ye)就順理成(cheng)章,此消彼(bi)長(chang)的(de)情況(kuang)下(xia)(xia)對于(yu)《黃(huang)金(jin)(jin)時代》的(de)“容忍”期(qi)也(ye)(ye)就只有(you)上映首日(ri)和次日(ri),隨(sui)后的(de)排片量(liang)當然也(ye)(ye)就銳減——想(xiang)想(xiang)影(ying)院(yuan)經理們的(de)獎金(jin)(jin)、工資(zi)都指望著這七天呢。


這當然(ran)是行業情報的(de)(de)一部分,還包括(kuo)對于同檔期競爭(zheng)影片的(de)(de)形(xing)勢掌(zhang)握(wo),一個或許比《黃金時代》更典型(xing)的(de)(de)例(li)子是《絕命逃亡》。


創投分(fen)享會暑期時與(yu)該(gai)片(pian)片(pian)方有(you)過(guo)溝通,我(wo)們對該(gai)片(pian)選(xuan)在國慶(qing)黃金檔持保(bao)留(liu)意見,但(dan)片(pian)方方面顯示出了特別的(de)樂觀,唯一認為能夠形(xing)成競(jing)爭的(de)對手就是《心花路放》——直到檔期臨近的(de)最(zui)后(hou)一天,《絕命(ming)逃亡》似乎才看清了競(jing)爭形(xing)勢,上演了一出絕命(ming)逃亡——撤檔。


搜狗方(fang)面坦言:“由于未知因(yin)素(su)比(bi)較(jiao)多(duo),且不可(ke)控(kong),在計算(suan)過程中(zhong),很多(duo)因(yin)素(su)無法量(liang)(liang)化或(huo)者引入進來。因(yin)此只能(neng)(neng)把握幾個最(zui)主要的(de)(de)因(yin)素(su),盡(jin)可(ke)能(neng)(neng)控(kong)制影響,預測本身(shen)即存在局(ju)限性。”而(er)這(zhe)些未知因(yin)素(su),也正是大量(liang)(liang)基于人腦(nao)才(cai)能(neng)(neng)收(shou)集和(he)判斷的(de)(de)情(qing)報,無法數據化的(de)(de)進入數字化的(de)(de)計算(suan)范圍(wei)。


王舒(shu)告(gao)訴(su)創投(tou)分享會君,在(zai)她(ta)了解的(de)(de)(de)范(fan)圍(wei)內(nei),他(ta)認(ren)為,迄今為止(zhi),影院經理仍然是(shi)能夠(gou)做出(chu)最(zui)準(zhun)確票(piao)房預(yu)測的(de)(de)(de)專家。他(ta)們對(dui)于檔期(qi)內(nei)的(de)(de)(de)競爭情報和影片(pian)內(nei)容的(de)(de)(de)了解最(zui)全面(mian),他(ta)們對(dui)于服務(wu)的(de)(de)(de)觀(guan)眾的(de)(de)(de)消(xiao)費(fei)(fei)行為、消(xiao)費(fei)(fei)心理掌握最(zui)透徹,因此也最(zui)能夠(gou)做出(chu)較小誤差的(de)(de)(de)票(piao)房預(yu)測——但(dan)只是(shi)針對(dui)所經營影院的(de)(de)(de)各片(pian)成(cheng)績。如(ru)果有能力對(dui)影院經理們做逐一的(de)(de)(de)統計,或是(shi)合理取樣,可能比互聯網(wang)平臺的(de)(de)(de)數(shu)據更接近觀(guan)眾。


票房預測沒有意義,電影領域談大數據尚言之過早


“大(da)數據不實用。”王舒認(ren)為(wei),“做這種預(yu)測(ce),對于電影票房并沒有直接的(de)幫(bang)助(zhu)(zhu)。這是一個(ge)無(wu)法(fa)(fa)證(zheng)偽,也無(wu)法(fa)(fa)證(zheng)實的(de)預(yu)測(ce)。”映前的(de)票房預(yu)測(ce)如果預(yu)測(ce)高了,片方也不會(hui)就(jiu)不作(zuo)為(wei),干等勝(sheng)利成果,那(nei)么預(yu)測(ce)后(hou)所進(jin)行的(de)努(nu)力(li)就(jiu)成了對于票房最(zui)終結果的(de)助(zhu)(zhu)力(li),從而也就(jiu)無(wu)法(fa)(fa)證(zheng)實彼(bi)時(shi)(shi)的(de)預(yu)測(ce)與此時(shi)(shi)的(de)成績之間(jian)是否可以稱作(zuo)是準確(que)。反之亦(yi)然(ran),預(yu)測(ce)低了,片方當然(ran)會(hui)盡最(zui)大(da)努(nu)力(li)調整營銷策(ce)略(lve),那(nei)無(wu)論最(zui)終準確(que)與否都無(wu)法(fa)(fa)判斷彼(bi)時(shi)(shi)預(yu)測(ce)的(de)結果究竟對與否。因(yin)此,除了為(wei)影片增加(jia)噱頭外(wai),票房預(yu)測(ce)可以說(shuo)沒有價值。


凌(ling)毅(yi)告(gao)訴(su)創投分(fen)享(xiang)會君,樂視影(ying)業內部的(de)(de)數據及策略中(zhong)心,會在電影(ying)的(de)(de)投資階段,便參與到對項目的(de)(de)市場(chang)評估(gu),幫助影(ying)片在制作上(shang)做(zuo)調整(zheng)。而(er)在電影(ying)進入到發行階段之后,更會基于對本體、檔期(qi)、競品(pin)等(deng)的(de)(de)數據分(fen)析,來(lai)制定(ding)相應(ying)的(de)(de)市場(chang)策略,包(bao)括通過對實施效果的(de)(de)實時監測,來(lai)修正和調整(zheng)營(ying)銷策略。凌(ling)毅(yi)強調,數據分(fen)析更像是一個工具,它能修正經驗(yan)及主觀意(yi)識(shi)的(de)(de)偏見,幫助片方(fang)在營(ying)銷上(shang)少做(zuo)錯誤的(de)(de)決策,但(dan)絕(jue)不是包(bao)治(zhi)百(bai)病的(de)(de)萬靈丹(dan)。


“目前(qian),電影(ying)領域談(tan)大(da)數(shu)(shu)(shu)據,還有一點為(wei)時過早。”凌毅認為(wei),電影(ying)行(xing)業仍然(ran)還是(shi)(shi)傳統產(chan)業,從(cong)(cong)制造(zao)到消費都(dou)是(shi)(shi)線(xian)(xian)下完(wan)成(cheng),即(ji)便現(xian)在有電商介入購票環(huan)節,但是(shi)(shi)絕大(da)部(bu)分的(de)(de)線(xian)(xian)下行(xing)為(wei)都(dou)無法數(shu)(shu)(shu)據化導入到線(xian)(xian)上,從(cong)(cong)而形成(cheng)具(ju)(ju)有因(yin)果關聯(lian)性(xing)的(de)(de)大(da)數(shu)(shu)(shu)據沉淀。“包括在樂(le)視影(ying)業內部(bu),目前(qian)數(shu)(shu)(shu)據對我(wo)們最具(ju)(ju)意義(yi)的(de)(de)部(bu)分,其實(shi)在于它是(shi)(shi)一套培養良好思維習慣的(de)(de)工具(ju)(ju),大(da)數(shu)(shu)(shu)據的(de)(de)前(qian)景在將來。”


王舒與凌毅觀點(dian)相似(si),他認為(wei)大數據(ju)盡(jin)管不(bu)同于過去(qu)強(qiang)調因(yin)果(guo)關系(xi)的(de)(de)(de)統計分析,但強(qiang)調關聯性的(de)(de)(de)大數據(ju)并非無需因(yin)果(guo),仍然需要有因(yin)果(guo)關系(xi)的(de)(de)(de)數據(ju)導入——否則,全世界發(fa)生的(de)(de)(de)事(shi)情都只要用“蝴蝶效應”來解釋就足矣。


僅就(jiu)電(dian)(dian)影(ying)(ying)行(xing)業(ye)(ye)的(de)大數(shu)(shu)據(ju)而言,一方面需(xu)要較長時間的(de)歷(li)史(shi)沉(chen)淀數(shu)(shu)據(ju)——王舒認為是(shi)(shi)十年后,另一方面需(xu)要有(you)大量的(de)第三方公司參(can)與到(dao)行(xing)業(ye)(ye)中來,幫助打通各個陣營、領域、行(xing)業(ye)(ye)中“孤立(li)”的(de)數(shu)(shu)據(ju),關聯才是(shi)(shi)大數(shu)(shu)據(ju)中“大”的(de)真正(zheng)價值(zhi)。因此,沉(chen)淀票(piao)房的(de)歷(li)史(shi)數(shu)(shu)據(ju)以及與電(dian)(dian)影(ying)(ying)行(xing)業(ye)(ye)有(you)關的(de)其(qi)他(ta)數(shu)(shu)據(ju)才是(shi)(shi)當務之(zhi)急,經年累月后,這些大數(shu)(shu)據(ju)能夠產生巨大的(de)分析(xi)價值(zhi)——不止于票(piao)房預測。

知名風險投資公司
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Copyright©創業聯(lian)合網 ALL Rights Reserved
商務與客服聯系微信