ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

go 爬取邮箱代码

2020-06-11 22:57:55  阅读:202  来源: 互联网

标签:qq string err fmt 爬取 go 邮箱 com


package main

import (
	"net/http"
	"fmt"
	"io/ioutil"
	"regexp"
)

var url string = "https://tieba.baidu.com/p/5518324938?red_tag=1795043739"
var reEmail = `(\d+)@qq.com`
func main()  {

	resp, err := http.Get(url)
	handError(err)

	defer resp.Body.Close()

	bytesContent, err := ioutil.ReadAll(resp.Body)

	handError(err)

	getEmail(string(bytesContent))

}

// 处理错误
func handError(err error)  {
	//fmt.Println(err)
	if err != nil{
		fmt.Println(err)
	}

}

// 获取邮箱 qq邮箱 使用正则
func getEmail(content string)  {
	re := regexp.MustCompile(reEmail)
	list := re.FindAllStringSubmatch(content, -1)

	var result []string

	for _,v := range list {
		if v != nil{
			result = append(result,v[0])
		}

	}
	fmt.Println(result)

}

  

结果

 

GOROOT=/usr/local/go #gosetup
GOPATH=/www/gopath #gosetup
/usr/local/go/bin/go build -i -o /private/var/folders/fc/4txmmczj6q92p6058h3w7t_80000gn/T/___go_build_main_go /www/gopath/src/wang/main.go #gosetup
/private/var/folders/fc/4txmmczj6q92p6058h3w7t_80000gn/T/___go_build_main_go #gosetup
[3304778804@qq.com 742948861@qq.com 1261766424@qq.com 2903927557@qq.com 973327005@qq.com 973327005@qq.com 51061804@qq.com 3154089413@qq.com 2501667505@qq.com 1733510262@qq.com 289207537@qq.com 11886843@qq.com 1069016912@qq.com 765730856@qq.com 643074575@qq.com 330256148@qq.com 2025643306@qq.com 1903987556@qq.com 136772698@qq.com 990242520@qq.com 876958445@qq.com 776283765@qq.com 184756372@qq.com 2580145919@qq.com 710830708@qq.com 459618331@qq.com 964974049@qq.com 1499820286@qq.com 1822036045@qq.com 29522755@qq.com 1903987556@qq.com 2444694413@qq.com]

Process finished with exit code 0

 

package main

import (
	"net/http"
	"fmt"
	"io/ioutil"
	"regexp"
)

var url string = "https://tieba.baidu.com/p/5934645800"
var reQQEmail = `(\d+)@qq.com`
var reEmail = `\w+@\w+\.\w+`
func main()  {

	content := getPageString(url)
	res1 := getEmail(content,reEmail)
	res2 := getEmail(content,reQQEmail)

	fmt.Println("一共找到邮箱",len(res1))
	fmt.Println("一共找到邮箱",len(res2))

}

// 处理错误
func handError(err error)  {
	//fmt.Println(err)
	if err != nil{
		fmt.Println(err)
	}

}

// 获取邮箱 qq邮箱 使用正则
func getEmail(content string,reg string) []string {
	re := regexp.MustCompile(reg)
	list := re.FindAllStringSubmatch(content, -1)

	var result []string

	for _,v := range list {
		if v != nil{
			result = append(result,v[0])
		}

	}
	return result

}

func getPageString(url string)  string {
	resp, err := http.Get(url)
	handError(err)

	defer resp.Body.Close()

	bytesContent, err := ioutil.ReadAll(resp.Body)

	handError(err)
	return string(bytesContent)
}

  

标签:qq,string,err,fmt,爬取,go,邮箱,com
来源: https://www.cnblogs.com/php-linux/p/13096577.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有