好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > Java用正則表達式如何讀取網頁內容

Java用正則表達式如何讀取網頁內容

熱門標簽:宿遷智能外呼系統供應商 鄂州人工智能電銷機器人軟件 菏澤智能ai電銷機器人銷售公司 地圖標注字母的軟件 線上教育ai外呼系統 實用地圖標注app 400免費電話去哪申請 地圖標注商戶中心要收錢多少 css百度地圖標注位置顯示

學習java的正則表達式,抓取網頁并解析HTML部分內容  

package com.xiaofeng.picup;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/** *//**
*
* @抓取頁面文章標題及內容(測試) 手動輸入網址抓取,可進一步自動抓取整個頁面的全部內容
*
*/
public class WebContent ...{
  /** *//**
   * 讀取一個網頁全部內容
   */
  public String getOneHtml(String htmlurl) throws IOException...{
    URL url;
    String temp;
    StringBuffer sb = new StringBuffer();
    try ...{
      url = new URL(htmlurl);
      BufferedReader in = new BufferedReader(new InputStreamReader(url
          .openStream(), "utf-8"));// 讀取網頁全部內容
      while ((temp = in.readLine()) != null) ...{
        sb.append(temp);
      }
      in.close();
    }catch(MalformedURLException me)...{
      System.out.println("你輸入的URL格式有問題!請仔細輸入");
      me.getMessage();
      throw me;
    }catch (IOException e) ...{
      e.printStackTrace();
      throw e;
    }
    return sb.toString();
  }
  /** *//**
   *
   * @param s
   * @return 獲得網頁標題
   */
  public String getTitle(String s) ...{
    String regex;
    String title = "";
    ListString> list = new ArrayListString>();
    regex = "title>.*?/title>";
    Pattern pa = Pattern.compile(regex, Pattern.CANON_EQ);
    Matcher ma = pa.matcher(s);
    while (ma.find()) ...{
      list.add(ma.group());
    }
    for (int i = 0; i  list.size(); i++) ...{
      title = title + list.get(i);
    }
    return outTag(title);
  }
  /** *//**
   *
   * @param s
   * @return 獲得鏈接
   */
  public ListString> getLink(String s) ...{
    String regex;
    ListString> list = new ArrayListString>();
    regex = "a[^>]*href=("([^"]*)"|'([^']*)'|([^s>]*))[^>]*>(.*?)/a>";
    Pattern pa = Pattern.compile(regex, Pattern.DOTALL);
    Matcher ma = pa.matcher(s);
    while (ma.find()) ...{
      list.add(ma.group());
    }
    return list;
  }
  /** *//**
   *
   * @param s
   * @return 獲得腳本代碼
   */
  public ListString> getScript(String s) ...{
    String regex;
    ListString> list = new ArrayListString>();
    regex = "script.*?/script>";
    Pattern pa = Pattern.compile(regex, Pattern.DOTALL);
    Matcher ma = pa.matcher(s);
    while (ma.find()) ...{
      list.add(ma.group());
    }
    return list;
  }
  /** *//**
   *
   * @param s
   * @return 獲得CSS
   */
  public ListString> getCSS(String s) ...{
    String regex;
    ListString> list = new ArrayListString>();
    regex = "style.*?/style>";
    Pattern pa = Pattern.compile(regex, Pattern.DOTALL);
    Matcher ma = pa.matcher(s);
    while (ma.find()) ...{
      list.add(ma.group());
    }
    return list;
  }
  /** *//**
   *
   * @param s
   * @return 去掉標記
   */
  public String outTag(String s) ...{
    return s.replaceAll(".*?>", "");
  }

您可能感興趣的文章:
  • JAVA使用爬蟲抓取網站網頁內容的方法
  • java抓取網頁數據獲取網頁中所有的鏈接實例分享
  • java正則表達式匹配網頁所有網址和鏈接文字的示例
  • java簡單網頁抓取的實現方法
  • Java中使用正則表達式獲取網頁中所有圖片的路徑
  • java 抓取網頁內容實現代碼
  • java抓取網頁數據示例
  • java實現網頁解析示例
  • 用javascrpt將指定網頁保存為Excel的代碼
  • Java獲取任意http網頁源代碼的方法

標簽:梅州 鞍山 恩施 池州 三亞 咸陽 六安 綿陽

巨人網絡通訊聲明:本文標題《Java用正則表達式如何讀取網頁內容》,本文關鍵詞  Java,用,正則,表達式,如何,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Java用正則表達式如何讀取網頁內容》相關的同類信息!
  • 本頁收集關于Java用正則表達式如何讀取網頁內容的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 美女隐私秘?黄www网站游戏| 国产精品日本| 二十八岁未成年在线播放免费| 双腿打开呻吟喷水调教H男男视频 粗大的内捧猛烈进出在线观看 | 99久久亚洲| 丝袜在线播放| 调教白丝女仆被弄得娇喘不停| 久久99精品波多结衣一区| 丝瓜污视频| X下载| 精品哟哟哟国产在线不卡| 蜜臀AV人妻国产精品建身房| 景甜国产一区二区麻豆| 99久久精品免费看国产四区| 色戒未删减完整版在线观看| 男女滚床单| 自我惩罚的方法要狠毒1到50种 | 亚洲a视频在线观看| 免费三片在线观看网站| 男人给女人免费囗交视频| 91精品国产91久久综合桃花| 流水了好爽痒好想要| 16xxxx18中国娇小| 激情调教女仆培训学校全文免费阅读| 日本一级特级毛片视频| 国产一级片网址| 久久精品国产99久久99久久久| 非洲黑人高清一级毛片| 久久久久精品国产毛片售后服务| 亚洲精品国产精品国自产观看 | 乱欲狂欢| 大尺度做爰呻吟小说疯狂进出 | 亚洲天堂中文字幕| 地瓜视频| 好硬啊进的太深了A片69视频| 琪琪影影2理论| 国产成a人片在线观看视频| 国产美女精品视频国产AV红豆 | 欧美乱大交xxxxx在线观看| 欧美一区二区三区日韩免费播 | 久久久久久久久精品免费高清上线 |