Golang StartCrawl示例

编程语言: Golang

命名空间/包名称: github.com/fduxiao/w3crawl

方法/功能: StartCrawl

hotexamples.com的示例: 2

Golang StartCrawl - 已找到2个示例。这些是从开源项目中提取的最受好评的github.com/fduxiao/w3crawl.StartCrawl现实Golang示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： main.go 项目： fduxiao/w3crawl

func crawlSave(url string, depth int, filename string) {
	var processor w3crawl.Processor
	pp := w3crawl.PrintProcessor{}
	pp.IfContinue = true
	sp := NewSearchProcessor()
	pp.Another = &sp
	processor = pp

	w3crawl.StartCrawl(url, depth, w3crawl.WebFetcher{}, processor)
	sp.BuildRank(0.85, 0.001)

	var r []PageInfo
	for _, one := range sp.AllPage {
		r = append(r, one)
	}
	b, err := json.Marshal(r)
	if err != nil {
		panic(err)
	}
	f, err := os.Create(filename)
	if err != nil {
		panic(err)
	}

	f.Write(b)
}

示例#2

显示文件

文件： main.go 项目： fduxiao/w3crawl

func main() {
	var processor w3crawl.Processor // used to process each url and body
	hasPrevProcessor := false

	f := flag.Bool("f", false, "use the file processor")
	p := flag.Bool("p", false, "use the print processor")

	// parse the args
	flag.Parse()
	args := flag.Args()
	host := args[0]
	n, err := strconv.Atoi(args[1])
	if err != nil {
		panic(err)
	}

	if *f {
		hasPrevProcessor = true
		processor = w3crawl.FileProcessor{}
	}
	if *p {
		pp := w3crawl.PrintProcessor{}
		pp.IfContinue = false
		if hasPrevProcessor {
			pp.IfContinue = true
			pp.Another = processor
		}
		hasPrevProcessor = true
		processor = pp
	}

	// no processor is specified
	if !hasPrevProcessor {
		processor = w3crawl.PrintProcessor{IfContinue: false}
	}

	w3crawl.StartCrawl(host, n, w3crawl.WebFetcher{}, processor)
}