中文字幕在线一区二区在线,久久久精品免费观看国产,无码日日模日日碰夜夜爽,天堂av在线最新版在线,日韩美精品无码一本二本三本,麻豆精品三级国产国语,精品无码AⅤ片,国产区在线观看视频

      軟件工程數(shù)據(jù)挖掘存在的挑戰(zhàn)與解決方案

      時間:2024-08-16 19:24:12 計算機軟件畢業(yè)論文 我要投稿
      • 相關推薦

      軟件工程數(shù)據(jù)挖掘存在的挑戰(zhàn)與解決方案

        軟件工程數(shù)據(jù)挖掘工作的最后階段是將獲取的挖掘信息呈現(xiàn)給所需用,下面是小編搜集的一篇關于軟件工程數(shù)據(jù)挖掘問題探究的論文范文,歡迎閱讀借鑒。

      軟件工程數(shù)據(jù)挖掘存在的挑戰(zhàn)與解決方案

        1 引言(Introduction)

        數(shù)據(jù)挖掘技術既是在海量的數(shù)據(jù)當中將需求信息挖掘出來的過程[1].軟件工程數(shù)據(jù)挖掘則是數(shù)據(jù)挖掘技術在軟件工程領域的重要應用[2].軟件工程數(shù)據(jù)挖掘技術可以有效地提高軟件的開發(fā)效率,增強軟件的穩(wěn)定性以及可用性,隨著軟件工程數(shù)據(jù)挖掘技術的不斷提升,其應用范圍更加的廣泛[3].因此,對其的研究工作不僅具有重要的學術價值,更具有重大的實際應用價值。本文重點探索軟件工程數(shù)據(jù)挖掘技術面臨的挑戰(zhàn)以及將來的發(fā)展趨勢。

        2 軟件工程數(shù)據(jù)挖掘(Software engineering datamining)

        (1)軟件工程數(shù)據(jù)挖掘的必要性

        軟件工程數(shù)據(jù)主要是指在軟件開發(fā)階段積累的相關數(shù)據(jù),其中包括軟件的可行性分析以及需求分析文本,軟件的注釋或者代碼等等。這些信息是軟件開發(fā)者獲取軟件相關數(shù)據(jù)的唯一來源。隨著軟件研發(fā)技術以及規(guī)模的不斷提升,其中包括的軟件工程數(shù)據(jù)也是成指數(shù)性增長。例如:Linux操作系統(tǒng)軟件,其僅代碼一項就超過了500萬行。這在無形中增加了軟件開發(fā)者獲取軟件相關數(shù)據(jù)的難度。因此,借助于數(shù)據(jù)挖掘技術的軟件工程信息搜索技術是十分必要的。

        (2)軟件工程數(shù)據(jù)挖掘任務及其過程

        一般來講,軟件工程的數(shù)據(jù)挖掘工作主要包括:

        a.軟件數(shù)據(jù)的預處理。這一過程主要是將未曾加工的數(shù)據(jù)變?yōu)楸阌谕诰虺鰜淼男问健F渲饕婕暗讲煌瑏碓匆约案袷綌?shù)據(jù)的融合,進而轉化成為統(tǒng)一格式的數(shù)據(jù)。選取數(shù)據(jù)挖掘任務有關的數(shù)據(jù)記錄,并對數(shù)據(jù)中的噪音以及重復值進行清理。目前,數(shù)據(jù)挖掘的預處理技術主要采用的是LSA、PLSA、LDA等。

        b.數(shù)據(jù)挖掘。這一過程主要是要將海量數(shù)據(jù)中能夠反映出軟件本質或者規(guī)律的信息搜取出來。其中運用了大量的算法。輸入的是結構規(guī)整的數(shù)據(jù),而將關聯(lián)、分類等信息模式進行輸出,這些信息模式與挖掘任務有關。

        c.結果評估。這一過程的目的就是要是用戶獲得有用的信息。主要包括提出信息質量不高的部分結果數(shù)據(jù),以及將計算機處理以及理解的信息模式轉換成為用戶能夠理解的信息模式,并傳遞給用戶。

        2 軟件工程數(shù)據(jù)挖掘存在的挑戰(zhàn)(Challenge ofsoftware engineering data mining)

        (1)軟件工程數(shù)據(jù)復雜度高

        目前的軟件工程數(shù)據(jù)主要包括結構化和非結構化兩類數(shù)據(jù)。其中,結構化數(shù)據(jù)主要涉及到軟件的版本相關信息以及缺陷報告等。非結構化數(shù)據(jù)主要包括一些軟件代碼、文檔等。這兩類數(shù)據(jù)不能采取同一種算法,但是兩類數(shù)據(jù)之間卻又存在著諸多相關性。因此,在數(shù)據(jù)挖掘算法開發(fā)上,要充分的考慮到兩類數(shù)據(jù)的復雜聯(lián)系,無形中增加了不小的難度。

        (2)分析方法并非傳統(tǒng)模式

        軟件工程數(shù)據(jù)挖掘工作的最后階段是將獲取的挖掘信息呈現(xiàn)給所需用戶。在傳統(tǒng)的數(shù)據(jù)挖掘應用過程中,例如:銀行或者電子商務,都是將其轉化為文字或者圖表的形式。但是,軟件開發(fā)者所需的信息并沒有如此簡單。其囊括了編程模板、缺陷定位等客戶信息。因此,這對數(shù)據(jù)挖掘技術提出了更高要求。

        (3)數(shù)據(jù)挖掘結果評價標準不一

        數(shù)據(jù)挖掘技術在很多行業(yè)都已經(jīng)廣泛應用,并且,在結果表示以及評價標準制定等方面較為成熟,但是,在軟件工程數(shù)據(jù)挖掘領域卻不是這樣。軟件開發(fā)者需要獲取的信息不僅詳細而且極為復雜,同時,信息的表示方法也不盡相同,這樣一來,為信息對比增加了不小的難度,因此,很難對數(shù)據(jù)挖掘結果進行定量準確分析。

        3 軟件工程數(shù)據(jù)挖掘問題的解決方案(Solution ofsoftware engineering data mining)

        (1)數(shù)據(jù)復雜性解決方法

        軟件工程數(shù)據(jù)的復雜性主要包括三方面:

        a.數(shù)據(jù)的類型相對復雜。關于這一類型,目前一些學者提出可以從軟件程序的結構圖以及文本數(shù)據(jù)等方面進行信息挖掘。

        b.數(shù)據(jù)間聯(lián)系復雜。這一類型可以利用算法的改進,增強發(fā)現(xiàn)數(shù)據(jù)之間聯(lián)系能力來提升數(shù)據(jù)挖掘結果的準確程度,例如:社會網(wǎng)絡分析法比較適用于尚未存在大量研究工作的領域。

        c.數(shù)據(jù)中存在噪音或缺失。這一類型可以采用類似于半監(jiān)督學習的方法以達到有效控制因數(shù)據(jù)缺失所帶來的不良影響程度。

        總而言之,通過數(shù)據(jù)挖掘算法的不斷改進,能夠有效地解決數(shù)據(jù)復雜性問題。

        (2)非傳統(tǒng)分析的解決方法

        相對于文字、圖表等信息形式,軟件開發(fā)者往往更需要軟件使用范例。目前,很多研究成果會涉及到軟件使用例程以及編程規(guī)則等。同時,在軟件工程當中,程序可視化作為一種信息表示方法正在逐漸成為趨勢,其與數(shù)據(jù)挖掘技術相結合,將會極大的滿足更多的非傳統(tǒng)分析需求。

        (3)挖掘結果評估問題解決方法

        傳統(tǒng)的評估體系很難在軟件工程數(shù)據(jù)挖掘中應用。為了解決這一問題,一些研究者試圖利用缺陷檢測效果評估法進行挖掘數(shù)據(jù)評價,但是,這種方法有點以偏概全的嫌疑。還有一些學者采用用戶體驗評價方法,但是在用戶較少的情況下,結果評價的客觀性不足。軟件工程領域無論是理論研究還是實際應用,其服務對象始終都是人,由此可見,軟件工程數(shù)據(jù)挖掘的結果評價方法會越來越貼近人類心理學以及管理學中的分析方法。

        4 軟件工程數(shù)據(jù)挖掘的發(fā)展趨勢(Developmenttrend of software engineering data mining)

        (1)基于現(xiàn)有問題,開法高性能挖掘算法

        a.軟件工程數(shù)據(jù)的檢索由精確的關鍵詞檢索向模糊檢索、甚至不受格式限制的自然語言檢索發(fā)展,檢索返回的內容從簡單的語句向完整的文檔發(fā)展。

        b.缺陷檢測工具從僅能夠檢測缺陷的原因向更加復雜、范圍更加廣泛的缺陷發(fā)展。

        c.用人類自然語言表達行為方法及軟件行為的模型將更加豐富,對應的表達能力也會大幅度提升。

        (2)提出更為復雜的問題及其解決方法。

        a.將研究基于數(shù)據(jù)挖掘技術的軟件結構分析方法。

        b.將研究軟件行為的評價方法和惡意軟件檢測方法。

        c.通過數(shù)據(jù)挖掘方法定量分析、評估與預測軟件的穩(wěn)定性,從而指導軟件的開發(fā)和維護。

        d.進一步發(fā)現(xiàn)數(shù)據(jù)之間的關系,綜合利用多方面的數(shù)據(jù)源進行挖掘。

        (3)高效預處理,改進挖掘算法

        研究更高效的數(shù)據(jù)預處理方法,最主要研究特征提取和數(shù)據(jù)降維方法;推進異構數(shù)據(jù)的管理和整合技術,如數(shù)據(jù)融合、數(shù)據(jù)空間等,以及分布式數(shù)據(jù)的并行處理技術。

        (4)引入新的軟件工程理念,指導數(shù)據(jù)挖掘工作

        隨著計算機網(wǎng)絡技術的不斷發(fā)展,軟件開發(fā)工作逐漸呈現(xiàn)出了高效化、智能化,網(wǎng)絡化特征。這些更是成為軟件開發(fā)人以及數(shù)據(jù)的基本特征。正因為如此,軟件模塊的開發(fā)工作更加趨向于功能性以及可重用性。這樣發(fā)展趨勢勢必會導致軟件工程數(shù)據(jù)挖掘技術研究方向的改變。利用數(shù)據(jù)挖掘技術采集、整合網(wǎng)絡數(shù)據(jù),獲得信息的方法;以及利用數(shù)據(jù)挖掘工具設計軟件重用的規(guī)范和模式,以輔助可重用模塊的開發(fā)。

        5 結論(Conclusion)

        隨著計算機技術的快速發(fā)展,人們的生活也逐漸的進入到了網(wǎng)絡化時代。各種應用軟件的開發(fā)速度之快令人震驚,而這也對軟件工程數(shù)據(jù)挖掘工作提出了更多、更高的要求。本文首先對軟件工程數(shù)據(jù)挖掘技術的相關概念進行分析,然后,對其遇到的挑戰(zhàn)和應對措施進行探索,最后,研究其未來的發(fā)展趨勢。希望能夠為有關的研究工作者提供一些參考性的建議。

        參考文獻(References)

        [1] 毛澄映,盧炎生,胡小華。數(shù)據(jù)挖掘技術在軟件工程中的應用綜述[J].計算機科學,2009(05):1-6.

        [2] 李新,張曉靜,米燕濤。軟件開發(fā)過程中的數(shù)據(jù)挖掘[J].石家莊職業(yè)技術學院學報,2007(02):31-33.

        [3] 趙志升,羅德林,李海英。數(shù)據(jù)挖掘技術與應用[J].河北北方學院學報(自然科學版),2006(06):63-66.

      【軟件工程數(shù)據(jù)挖掘存在的挑戰(zhàn)與解決方案】相關文章:

      數(shù)據(jù)挖掘理論在數(shù)據(jù)采集中的運用07-11

      數(shù)據(jù)挖掘的論文參考文獻10-14

      數(shù)據(jù)挖掘論文參考文獻09-16

      數(shù)據(jù)挖掘在CRM中的應用分析06-09

      基于聚類分析的數(shù)據(jù)挖掘方法06-27

      數(shù)據(jù)挖掘技術在CRM中的應用09-20

      關于數(shù)據(jù)挖掘論文參考文獻06-11

      基于數(shù)據(jù)挖掘的成績分析系統(tǒng)10-10

      旅游管理下數(shù)據(jù)挖掘運用論文09-27

      基于數(shù)據(jù)挖掘技術的交叉銷售分析09-27

      主站蜘蛛池模板: 日喀则市| 啊v在线视频| 国内精品人人妻少妇视频| 色偷偷亚洲第一综合网| 久久久高清免费视频| 777久久| 日韩久久av电影| 日韩美无码一区二区三区| 最新国产精品精品视频 | 亚洲AV无码一区二区一二区教师| 熟女系列丰满熟妇av| 亚洲人成伊人成综合网中文| 国产亚洲AV天天夜夜无码| 日韩中文字幕久久久经典网| 大田县| 商水县| 鹤庆县| 玛沁县| 夏河县| 仁怀市| 花垣县| 临汾市| av无码特黄一级| 新乡市| 迁西县| 日韩精品永久免费播放平台| 三河市| 蜜桃在线播放免费一区二区三区| 木兰县| 国产精品黄色片一区二区| 松溪县| 亚洲一区二区三区品视频| 国产丰满乱子伦无码专| 一本色道久久综合亚洲精品蜜臀| 国产亚洲av日韩av| 亚洲日本在线中文字幕| 亚欧免费视频一区二区三区| 亚洲精品成人av一区二区| 久久亚洲aⅴ精品网站婷婷| 桃子视频亚洲一二三区| 嗯啊 不要 啊啊在线日韩a|