Golang Page.SetUrlTagの例

プログラミング言語: Golang

名前空間/パッケージ名: git/oschina/net/ciweilao/game_spider/git/page

クラス/型: Page

メソッド/関数: SetUrlTag

hotexamples.comのコード掲載数: 1

Golang Page.SetUrlTag - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたGolangのgit/oschina/net/ciweilao/game_spider/git/page.Page.SetUrlTagの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

GetRequest(5)

IsSucc(3)

AddNewUrl(2)

AddPageItems(2)

IsBreak(2)

CountNewUrls(1)

GetBody(1)

GetErrMsg(1)

GetNewUrls(1)

GetPageItemsList(1)

SetBody(1)

SetBreak(1)

SetCookies(1)

SetHeader(1)

SetStatus(1)

SetUrlTag(1)

コード例 #1

ファイルを表示

ファイル: main.go プロジェクト: dulumao/game_spider

func (this *YouxiduoProcesser) Process(p *page.Page) {
	if !p.IsSucc() {
		println(p.GetErrMsg())
		return
	}
	var body string = p.GetBody()
	var urlTag string = p.GetRequest().GetUrlTag()
	p.SetUrlTag(urlTag)
	//分析这个页面是LIST页面还是内容页面
	// <div class="infroList"><ul><li>...</div>===>LIST
	// <div class="pagebreak">...</div>===>LIST
	// CONTENT
	//<div class="article"

	if urlTag == "list" {
		//
		//1.寻找news-brief的content
		regList, err := regexp.Compile(`<div class=\"infroList\">(\s|.)*<\/ul>(\s|.)*<div class=\"pagebreak\">`)
		if err != nil {
			logs.GetFirstLogger().Error("分析页面出错，正则表达式错误了，url = " + p.GetRequest().GetUrl())
		}
		var infroList []string = regList.FindAllString(body, -1)

		if len(infroList) > 0 {
			this.parseNewsBreifInfo(infroList[0], p)
		} else {
			logs.GetFirstLogger().Info("No more list items")
		}
		//先寻找额外的LIST页面
		if !p.IsBreak() {
			regPageBreak, err := regexp.Compile(`<div class=\"pagebreak\">(\s|.)+<li class=\"lastPage\">`)
			if err != nil {
				logs.GetFirstLogger().Error("分析页面出错，翻页正则表达式错误，url = " + p.GetRequest().GetUrl())
			}
			var pageBreakList []string = regPageBreak.FindAllString(body, -1)
			if len(pageBreakList) > 0 {
				this.parseNewsLinkListInfo(pageBreakList[0], p)
			} else {
				logs.GetFirstLogger().Info("No more links")
			}

		}

	} else {
		//CONTENT
		this.parseNewsDetail(body, p)
	}

}