Welcome 微信登录

首页 / 操作系统 / Linux / Linux C获取网页title

1. http 的知识,你需要使用 HTTP GET/POST 请网页2. 把网页请求下来,会得到一个 html,然后解析它3. 解析网页之后找到用户名与密码字段,最后打包出一个 HTTP POST 请求,完成用户名和密码提交4. 服务器会返回一个 HTTP 回应,你解析相应的 html 判断正确与否实践证明上面的思路是对HTTP协议不了解的结果,这样做的话基本上是做不出来的。客户端请求GET / HTTP/1.1 Host:www.google.com获得服务器的网页源码根据源码信息处理字符串获得其中的title里面的内容。Windows下的实现:发送的字符串处理
  1. /*  
  2.     * 分离url中的主机地址和相对路径  
  3.     */   
  4.     strcpy(myurl, url);   
  5.     for (pHost = myurl; *pHost != "/" && *pHost != ""; ++pHost);   
  6.     if ( (int)(pHost - myurl) == strlen(myurl) )   
  7.         strcpy(GET, "/");   
  8.     else   
  9.         strcpy(GET, pHost);   
  10.     *pHost = "";   
  11.     strcpy(host, myurl);  //myurl copy to struct struct hostent just like www.baidu.com   
  12.     printf("%s %s ", host, GET);   
  13.       
网络端口socket的初始化
  1. /*  
  2. * 设定socket参数,并未真正初始化  
  3. */   
  4. sockfd = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);   
  5. pURL = gethostbyname(host);   
  6. addr.sin_family = AF_INET;   
  7. addr.sin_addr.s_addr = *((unsigned long*)pURL->h_addr);   
  8. addr.sin_port = htons(80);   
发送http协议的规定
  1. /*  
  2. * 组织发送到web服务器的信息www.linuxidc.com  
  3. * 为何要发送下面的信息请参考HTTP协议的约定  
  4. */   
  5. strcat(header, "GET ");   
  6. strcat(header, GET);   
  7. strcat(header, " HTTP/1.1 ");   
  8. strcat(header, "HOST: ");   
  9. strcat(header, host);   
  10. strcat(header, " Connection: Close ");   
连接到服务器并发送
  1. /*  
  2. * 连接到服务器,发送请求header,并接受反馈(即网页源代码www.linuxidc.com)  
  3. */   
  4. connect(sockfd,(SOCKADDR *)&addr,sizeof(addr));   
  5.   
  6. send(sockfd, header, strlen(header), 0);   
处理字符串的主要实现:
  1. while ( recv(sockfd, text, BUFSIZ, 0) > 0)   
  2.     {   
  3.           
  4.         if (q=strstr(text,"<title>"))  
  5.         {         
  6.             q+=7;  
  7.             if((p=strtok(q,"</title>")))  
  8.             {  
  9.                 printf("%s ",p);  
  10.             }  
  11.         }  
  12.         //printf("%s",text);   
  13.         //memset(text,0,sizeof(text));   
  14.     }   
Linux下的实现类似,主要是在发送接收一些接口的修改,自己动手做提高会更高。我本人就是根据上面的源码进行修改,查询,才完成的,对于Linux下socket的应用真的是太广泛了,以前没有发现这么强大的socket,只是停留在表面没有沉到湖底领略无线风光,真的是感觉自己浪费了太多的时间了,没有好好的深入研究,以前也太浮躁了,自以为这些都很简单,殊不知难以完成。