亚洲av色香蕉一区二区三区,十四以下岁毛片带血a级,亚洲 校园 欧美 国产 另类,亚洲av日韩av一区谷露,色欲av无码一区二区三区

  • 相關(guān)軟件
    >如何寫ASP入庫小偷程序 創(chuàng)建者:webmaster 更新時(shí)間:2005-06-08 21:47

    個(gè)人主頁:http://www.cnmaya.org
    轉(zhuǎn)載請(qǐng)注明出自瑪雅論壇


    最近大家都對(duì)小偷程序感興趣,尤其是入庫類的,在這里我簡單的介紹一下。希望大家對(duì)這個(gè)能有所了解,如果您還不知道什么叫小偷,請(qǐng)參考我寫的另外一片文章(小偷程序原理和簡單示例
    ):http://www.im286.com/viewthread.php?tid=407182&fpage=2

    個(gè)人認(rèn)為小偷只是一個(gè)很通俗的說法,也給很多人帶來了誤解,認(rèn)為小偷是什么不好的東西,其實(shí)不然,用數(shù)據(jù)采集程序來形容應(yīng)該更準(zhǔn)確些。


    這里是我昨天剛完成的新浪娛樂入庫小偷程序::http://www.saynew.com/news/Class/popjb/popjb02.html
    在這里我根據(jù)該程序的制作簡單介紹一下:

    入庫小偷的原理也很簡單:就是用XMLHTTP遠(yuǎn)程讀取網(wǎng)頁的內(nèi)容,然后根據(jù)需要,對(duì)讀到的內(nèi)容進(jìn)行加工(過濾,替換,分類),最后得到自己需要的數(shù)據(jù),加入到數(shù)據(jù)庫中。

    首先:我們先用XMLHTTP讀取遠(yuǎn)程網(wǎng)頁(我的另一片文章中有介紹)。
    其次:對(duì)內(nèi)容進(jìn)行過濾,這個(gè)是比較關(guān)鍵的步驟,比如說,我要從遠(yuǎn)程網(wǎng)頁上提取出所有url連接,我應(yīng)該怎么做呢?



    CODE:


    ‘這里用的是正則式
    Set objRegExp = New Regexp   '建立對(duì)象
    objRegExp.IgnoreCase = True   '大小寫忽略
    objRegExp.Global = True       '全局為真
    objRegExp.Pattern = "http://.+?"   '匹配字段
    set mm=objRegExp.Execute(str)   '執(zhí)行查找,str為輸入?yún)?shù)
    For Each Match in mm     '進(jìn)入循環(huán)
        Response.write(Match.Value)   '輸出url地址
    next




    然后,我們需要根據(jù)需要做一些替換功能,把不必要的數(shù)據(jù)替換掉,這個(gè)比較簡單,用Replace函數(shù)即可。
    最后,進(jìn)行數(shù)據(jù)庫操作,這個(gè)我想大家應(yīng)該都會(huì),就不做介紹了。


    暫時(shí)就想到這些,大家在實(shí)際操作中有什么問題,歡迎一起探討,也歡迎來我的論壇一起討論,地址是:http://www.cnmaya.org
    相關(guān)文章
    本頁查看次數(shù):