毛片在线视频观看,一级日韩免费大片,在线网站黄色,澳门在线高清一级毛片

<dfn id="feuvz"></dfn>

<dl id="feuvz"><label id="feuvz"></label></dl>

薈聚奇文、博采眾長(zhǎng)、見(jiàn)賢思齊

公文素材庫(kù)手機(jī)版
最近更新

當(dāng)前位置：公文素材庫(kù) > 公文素材 > 范文素材 > 大數(shù)據(jù)在選題策劃中的應(yīng)用策劃書(shū)

大數(shù)據(jù)在選題策劃中的應(yīng)用策劃書(shū)

網(wǎng)站：公文素材庫(kù)　|　時(shí)間：2019-05-10 16:40:30　|　移動(dòng)端：大數(shù)據(jù)在選題策劃中的應(yīng)用策劃書(shū)

　　據(jù)全球權(quán)威的IT研究與咨詢公司Gartner于20xx年9月發(fā)布的大數(shù)據(jù)分析報(bào)告顯示，全球范圍內(nèi)的媒體和通信行業(yè)以及銀行金融業(yè)站在了大數(shù)據(jù)投資的最前沿。相比之下，出版業(yè)作為文化產(chǎn)業(yè)，承載著文化傳播與文化傳承的社會(huì)功能，然而在利用大數(shù)據(jù)洞悉讀者需求上表現(xiàn)欠佳，所以，如何借助不斷增長(zhǎng)的大數(shù)據(jù)進(jìn)行信息和知識(shí)的搜集、組織和傳播，成為出版企業(yè)亟待解決的問(wèn)題。

　　出版企業(yè)可利用的大數(shù)據(jù)的具體形式

　　對(duì)于“大數(shù)據(jù)”（Big Data），研究機(jī)構(gòu)Gartner給出了這樣的定義：“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。舉個(gè)例子，1分鐘的時(shí)間內(nèi)，新浪發(fā)送2萬(wàn)條微博，蘋(píng)果下載4.7萬(wàn)次應(yīng)用，淘寶賣出6萬(wàn)件商品，人人網(wǎng)發(fā)生30萬(wàn)次訪問(wèn)，百度產(chǎn)生90萬(wàn)次搜索查詢。由此可見(jiàn)，數(shù)據(jù)規(guī)模的急劇膨脹，各行業(yè)累積的數(shù)據(jù)量越來(lái)越巨大，數(shù)據(jù)類型也越來(lái)越多、越來(lái)越復(fù)雜，已經(jīng)超越了傳統(tǒng)數(shù)據(jù)管理系統(tǒng)、處理模式的能力范圍，于是“大數(shù)據(jù)”這樣一個(gè)“無(wú)窮大”的概念才會(huì)應(yīng)運(yùn)而生。大數(shù)據(jù)的特點(diǎn)可以被歸納為：數(shù)量巨大、類型多樣、實(shí)時(shí)快速、價(jià)值高但密度低。正式基于這樣的特點(diǎn)，出版企業(yè)可以結(jié)合產(chǎn)業(yè)的優(yōu)勢(shì)對(duì)大數(shù)據(jù)進(jìn)行充分的挖掘和利用。

　�。�1）Web文本挖掘。大數(shù)據(jù)的核心是挖掘龐大數(shù)據(jù)庫(kù)的獨(dú)有價(jià)值。面對(duì)因?yàn)榫W(wǎng)絡(luò)的飛速發(fā)展而帶來(lái)的信息膨脹，尤其是以半結(jié)構(gòu)化或非結(jié)構(gòu)化為主的文本信息，人們迫切需要研究出方便有效的工具去從中提取符合需要的“簡(jiǎn)潔的”“精煉的”“可理解的”知識(shí)，Web文本挖掘技術(shù)由此產(chǎn)生。而利用Web文本挖掘發(fā)現(xiàn)大數(shù)據(jù)的價(jià)值也成為可能。

　　文本挖掘是近幾年來(lái)數(shù)據(jù)挖掘領(lǐng)域的一個(gè)新興分支。文本挖掘也稱為文本數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)，是從大量文本的集合或語(yǔ)料庫(kù)中抽取事先未知的“可理解的”有潛在實(shí)用價(jià)值的模式和知識(shí)。而隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展，特別是Web應(yīng)用的不斷普及，網(wǎng)絡(luò)信息急劇增加，信息類型也越來(lái)越復(fù)雜。如何從這些大量自由、非結(jié)構(gòu)化或半結(jié)構(gòu)化的信息中獲得所需求的知識(shí)，傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)已不適用，解決問(wèn)題的一個(gè)途徑就是將傳統(tǒng)的文本挖掘技術(shù)和Web綜合起來(lái)，進(jìn)行Web文本挖掘。Web文本挖掘就是以萬(wàn)維網(wǎng)上的數(shù)據(jù)為分析對(duì)象，以抽取有用知識(shí)為目標(biāo)，把傳統(tǒng)文本挖掘技術(shù)和萬(wàn)維網(wǎng)相結(jié)合的研究技術(shù)。

　�。�2）出版企業(yè)可利用的Web文本數(shù)據(jù)。網(wǎng)絡(luò)上圖書(shū)評(píng)論的數(shù)量極為龐大，有些暢銷書(shū)可能包含成千上萬(wàn)的評(píng)論，借助Web文本挖掘技術(shù)能自動(dòng)地對(duì)圖書(shū)評(píng)論進(jìn)行分析和處理，挖掘出有用的信息。通過(guò)對(duì)圖書(shū)在線評(píng)論的挖掘管理，出版企業(yè)可以用較低的成本收集、整理讀者對(duì)于各類圖書(shū)的關(guān)注興趣和欣賞特點(diǎn)，同時(shí)也可以獲得暢銷圖書(shū)迎合市場(chǎng)需求的關(guān)鍵因素。在此過(guò)程中，企業(yè)獲得了知識(shí)資源，同時(shí)培育了持續(xù)的競(jìng)爭(zhēng)優(yōu)勢(shì)。因此，可以將各大圖書(shū)銷售網(wǎng)站的讀者評(píng)論作為出版企業(yè)可利用的大數(shù)據(jù)分析的首要來(lái)源。

　　在企業(yè)的銷售網(wǎng)站或其借助的其他互聯(lián)網(wǎng)銷售平臺(tái)上，通過(guò)建立在線評(píng)論客戶知識(shí)管理系統(tǒng)，收集、整理和分析客戶評(píng)論，將客戶評(píng)論轉(zhuǎn)化為企業(yè)的知識(shí)，從而為企業(yè)價(jià)值鏈的各個(gè)環(huán)節(jié)提供客戶的信息和知識(shí)的共享，并將客戶知識(shí)延伸到企業(yè)的決策制定中，為企業(yè)有效開(kāi)展客戶知識(shí)管理提供有效的解決方案。同時(shí)，基于評(píng)論挖掘構(gòu)建的客戶知識(shí)管理系統(tǒng)，具有與用戶需求同步的快速響應(yīng)能力，即具有將用戶需求迅速轉(zhuǎn)向圖書(shū)的策劃和印制的能力。這就使得出版企業(yè)以響應(yīng)市場(chǎng)需求為中心，實(shí)時(shí)挖掘客戶知識(shí)，提高優(yōu)化客戶關(guān)系的決策能力，準(zhǔn)確及時(shí)地向客戶提供所需的圖書(shū)產(chǎn)品。

　　大數(shù)據(jù)在選題策劃中的應(yīng)用

　　信息收集和預(yù)處理

　　相對(duì)于傳統(tǒng)數(shù)據(jù)庫(kù)中的完全結(jié)構(gòu)化的數(shù)據(jù)而言，Web數(shù)據(jù)的最大特點(diǎn)就是半結(jié)構(gòu)化。從評(píng)論挖掘的角度來(lái)看，Web上的網(wǎng)頁(yè)包含的信息并不都是有用的，體現(xiàn)網(wǎng)頁(yè)的主題信息的是“主題”內(nèi)容；與主題內(nèi)容無(wú)關(guān)的導(dǎo)航條、廣告信息等內(nèi)容則是“噪音”內(nèi)容。網(wǎng)頁(yè)凈化過(guò)程就是去掉包含噪音內(nèi)容的內(nèi)容塊，只保留網(wǎng)頁(yè)中包含主題內(nèi)容的內(nèi)容塊。因此在評(píng)論挖掘的數(shù)據(jù)預(yù)處理階段，首要任務(wù)就是完成Web網(wǎng)頁(yè)凈化過(guò)程，去除網(wǎng)頁(yè)內(nèi)容中的音頻、視頻、圖片等其他非文本信息，還有各種網(wǎng)頁(yè)本身的標(biāo)記語(yǔ)言，最后僅剩下網(wǎng)頁(yè)中的文字評(píng)論內(nèi)容，從Web頁(yè)面中提取出文本評(píng)論信息。

　　評(píng)論頁(yè)面的下載可以采用聚焦爬蟲(chóng)技術(shù)，所謂聚焦爬蟲(chóng)，是能實(shí)現(xiàn)自動(dòng)下載網(wǎng)頁(yè)功能的程序，它根據(jù)指定的抓取目標(biāo)，有選擇地獲取萬(wàn)維網(wǎng)上的網(wǎng)頁(yè)及其相關(guān)的鏈接，抓取所需要的信息。通過(guò)對(duì)Web頁(yè)面的語(yǔ)義結(jié)構(gòu)進(jìn)行描述，產(chǎn)生適合計(jì)算機(jī)自動(dòng)處理的描述文件和指令文件，實(shí)現(xiàn)持續(xù)地、大批量地提取Web信息。

　　圖書(shū)特征提取和情感分析

　　評(píng)論內(nèi)容是中文語(yǔ)句，要從中提取詞語(yǔ)，進(jìn)而獲得讀者關(guān)注的圖書(shū)特征，首先需借助中文分詞技術(shù)。中文分詞技術(shù)屬于自然語(yǔ)言處理技術(shù)領(lǐng)域，它通過(guò)詞性標(biāo)注將一個(gè)漢字序列切分成相互獨(dú)立的詞，文本挖掘的基礎(chǔ)是中文分詞，一段中文要使得計(jì)算機(jī)自動(dòng)識(shí)別語(yǔ)句語(yǔ)義，必須通過(guò)準(zhǔn)確的中文分詞處理。在中文分詞和詞性標(biāo)注的基礎(chǔ)上，使用漢語(yǔ)分詞軟件的關(guān)鍵詞提取功能提取評(píng)論內(nèi)容中的關(guān)鍵詞，按照權(quán)重排序找出高頻名詞或名詞性短語(yǔ)作為候選詞匯，通過(guò)人工定義和篩選，得到讀者評(píng)論中的圖書(shū)屬性特征詞集合。

　　挖掘出的圖書(shū)的讀者關(guān)注特征，是讀者圖書(shū)評(píng)論中最集中和最熱點(diǎn)的特征，但每項(xiàng)特征具體的評(píng)價(jià)傾向性還需進(jìn)一步分析和處理，即通過(guò)提取讀者對(duì)每項(xiàng)關(guān)注特征所持有的褒貶態(tài)度，分析其評(píng)價(jià)情感傾向性。情感詞可以細(xì)分為情感特征詞匯和情感強(qiáng)度詞匯�？蛻粼u(píng)論中的情感特征詞是客戶表明自身觀點(diǎn)和態(tài)度的詞匯，而情感強(qiáng)度詞是指評(píng)論中用于加強(qiáng)語(yǔ)氣的程度副詞，如“最”“非常”和一些否定詞。這些詞的修飾會(huì)加強(qiáng)或減弱，甚至改變?cè)瓉?lái)詞匯的情感傾向，在判斷評(píng)論的情感時(shí)要考慮這些強(qiáng)度詞語(yǔ)的作用。

來(lái)源：網(wǎng)絡(luò)整理免責(zé)聲明：本文僅限學(xué)習(xí)分享，如產(chǎn)生版權(quán)問(wèn)題，請(qǐng)聯(lián)系我們及時(shí)刪除。

《大數(shù)據(jù)在選題策劃中的應(yīng)用策劃書(shū)》由互聯(lián)網(wǎng)用戶整理提供,轉(zhuǎn)載分享請(qǐng)保留原作者信息,謝謝!
鏈接地址：http://m.seogis.com/gongwen/125232.html

上一篇：隊(duì)名的口號(hào)
下一篇：大學(xué)生試教自我鑒定范文

推薦專題

相關(guān)文章

1大數(shù)據(jù)在選題策劃中的應(yīng)用策劃書(shū)

最新文章

關(guān)于我們　|　網(wǎng)站地圖　|　法律聲明　|　法律顧問(wèn)　|　刪除申請(qǐng)　|　聯(lián)系我們

信用保障

公文素材庫(kù)友情提示：本網(wǎng)站所有內(nèi)容為共享上傳提供，不涉及任何商業(yè)利益，本站對(duì)此不承擔(dān)任何保證責(zé)任！

Copyright © m.seogis.com Corporation, All Rights Reserved 共享時(shí)代共享你我他版權(quán)所有

<b id="wctxx"><meter id="wctxx"></meter></b>

<thead id="wctxx"></thead>