首页 / 操作系统 / Linux / Linux内核分析 - 网络[三]:从netif_receive_skb()说起
在netif_receive_skb()函数中,可以看出处理的是像ARP、IP这些链路层以上的协议,那么,链路层报头是在哪里去掉的呢?答案是网卡驱动中,在调用netif_receive_skb()前, 相关阅读:Linux内核分析 - 网络[一]:收发数据包的调用 http://www.linuxidc.com/Linux/2011-05/36063.htmLinux内核分析 - 网络[二]:网卡驱动接收报文 http://www.linuxidc.com/Linux/2011-05/36064.htmLinux内核分析 - 网络[三]:从netif_receive_skb()说起 http://www.linuxidc.com/Linux/2011-05/36065.htmLinux内核分析 - 网络[四]:路由表 http://www.linuxidc.com/Linux/2011-05/36065.htmskb->protocol = eth_type_trans(skb, bp->dev);该函数对处理后skb>data跳过以太网报头,由mac_header指示以太网报头:进入netif_receive_skb()函数list_for_each_entry_rcu(ptype,&ptype_base[ntohs(type) & PTYPE_HASH_MASK], list)按照协议类型依次由相应的协议模块进行处理,而所以的协议模块处理都会注册在ptype_base中,实际是链表结构。netcoredev.cstatic struct list_head ptype_base __read_mostly; /* Taps */ 而相应的协议模块是通过dev_add_pack()函数加入的:void dev_add_pack(struct packet_type *pt){ int hash; spin_lock_bh(&ptype_lock); if (pt->type == htons(ETH_P_ALL)) list_add_rcu(&pt->list, &ptype_all); else { hash = ntohs(pt->type) & PTYPE_HASH_MASK; list_add_rcu(&pt->list, &ptype_base[hash]); } spin_unlock_bh(&ptype_lock);} 以ARP处理为例该模块的定义,它会在arp_init()中注册进ptype_base链表中:static struct packet_type arp_packet_type __read_mostly = { .type = cpu_to_be16(ETH_P_ARP), .func = arp_rcv,}; 然后在根据报文的TYPE来在ptype_base中查找相应协议模块进行处理时,实际调用arp_rcv()进行接收arp_rcv() --> arp_process()arp = arp_hdr(skb);……arp_ptr= (unsigned char *)(arp+1);sha= arp_ptr;arp_ptr += dev->addr_len;memcpy(&sip, arp_ptr, 4);arp_ptr += 4;arp_ptr += dev->addr_len;memcpy(&tip, arp_ptr, 4);操作后这指针位置:然后判断是ARP请求报文,这时先查询路由表ip_route_input()if (arp->ar_op == htons(ARPOP_REQUEST) && ip_route_input(skb, tip, sip, 0, dev) == 0)在ip_route_input()函数中,先在cache中查询是否存在相应的路由表项:hash = rt_hash(daddr, saddr, iif, rt_genid(net));缓存的路由项在内核中组织成hash表的形式,因此在查询时,先算出的hash值,再用该项- rt_hash_table[hash].chain即可。这里可以看到,缓存路由项包括了源IP地址、目的IP地址、网卡号。 如果在缓存中没有查到匹配项,或指定不查询cache,则查询路由表ip_route_input_slow();进入ip_route_input_slow()函数,最终调用fib_lookup()得到查询结果fib_resultif ((err = fib_lookup(net, &fl, &res)) != 0)如果结果fib_result合法,则需要更新路由缓存,将此次查询结果写入缓存hash = rt_hash(daddr, saddr, fl.iif, rt_genid(net));err = rt_intern_hash(hash, rth, NULL, skb, fl.iif); 在查找完路由表后,回到arp_process()函数,如果路由项指向本地,则应由本机接收该报文:if (addr_type == RTN_LOCAL) { …… if (!dont_send) { n = neigh_event_ns(&arp_tbl, sha, &sip, dev); if (n) { arp_send(ARPOP_REPLY,ETH_P_ARP,sip,dev,tip,sha,dev->dev_addr,sha); neigh_release(n); } } goto out; }首先更新邻居表neigh_event_ns(),然后发送ARP响应 – arp_send。至此,大致的ARP流程完成。由于ARP部分涉及到路由表以及邻居表,这都是很大的概念,在下一篇中介绍,这里直接略过了。