数据跟踪:翻滚吧!Web流量工具

日期: 2015-12-15 作者:Brad Irby翻译:boxi 来源:TechTarget中国 英文

随着对在线隐私的不断关注,知道数据发给谁、由哪个程序发出去就显得尤为重要。在此,我来给大家看看免费的Web跟踪工具是如何方便地获得此类信息的。 在我们这里永远连接的世界里,忘记我们机器上一直发出的不可见的Web请求是很容易的。在我不科学的测试里,我只让自己的机器空闲了1分钟,然后我的Web流量工具就记录了超过100条来自Facebook、Pinterest、Google Docs和微软OneDrive的Web请求。

这还只是在你不知情的情况下在Web上不断收发数据的部分来源而已。 这里有一些可以下载的流量分析工具。Wireshark这个名字已经有很长的一段历史,是个牢固的跨平台工具。然而,由于我……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

随着对在线隐私的不断关注,知道数据发给谁、由哪个程序发出去就显得尤为重要。在此,我来给大家看看免费的Web跟踪工具是如何方便地获得此类信息的。

在我们这里永远连接的世界里,忘记我们机器上一直发出的不可见的Web请求是很容易的。在我不科学的测试里,我只让自己的机器空闲了1分钟,然后我的Web流量工具就记录了超过100条来自Facebook、Pinterest、Google Docs和微软OneDrive的Web请求。这还只是在你不知情的情况下在Web上不断收发数据的部分来源而已。

这里有一些可以下载的流量分析工具。Wireshark这个名字已经有很长的一段历史,是个牢固的跨平台工具。然而,由于我是Windows开发者,并且是Telerik工具的粉丝,所以优先推荐的是免费工具Fiddler。这个工具提供了HTTPS流量分析、性能测试以及通过扩展增加定制功能的手段。

你可以下载和安装该Web流量工具Fiddler(注意如果不喜欢的话你不必提供电子邮件地址)。一旦安装后,运行Fiddler你就会看到界面显示你的机器发往Web的每一个请求。甚至你什么都没做,你也会惊讶地发现一台典型机器发出了多少的流量。

对于开发者来说,Fiddler是Web调试的一种手段,但它也为非开发者提供了大量信息。有了这一Web流量工具,一般的用户不用挖掘很深也能看到随数据发送的每一个请求以及来自远程服务器的响应。

要想看这些数据,只需要扫描下面这些默认列。

结果

结果列是请求是否成功的代码。最常见的代码包括:

  • 200—成功。请求已发送且响应已成功接收。
  • 400—坏请求。当目的服务器接收到请求但不理解细节所以无法处理时发生。
  • 404—页面找不到。如果目标API已移动或已更新但未保留向后兼容性时发生。
  • 500—内部服务器错误。服务器端发生了某种致命错误,且错误并被服务提供商捕获。

协议

协议可以用HTTP或HTTPS。HTTPS意味着使用了SSL,因此你的流量发送前是经过加密的。当然,这并不意味着HTTP就是不加密的流量(参见下面“主机”、“隧道”的讨论)

主机

主机(Host)要么是访问的URL根地址,要么是“隧道(Tunnel To)”。你也许注意到你大部分的敏感流量是通过这些隧道传输的,比如微软OneDrive、Google数据请求等。看起来这些流量似乎未经加密,因为列出来的协议是HTTP,不过请不要担心。“Tunnel To”意味着连接请求已经发出,这表明后续会有持续的流量发往目的网站。初始请求是通过SSL建立的,并且建立了一个到目的地的专门隧道。一旦隧道建立,所有的流量都是通过这条隧道传输,并且在离开你机器前就已经加密好了。

URL

指被请求的特定页面或者端点(或根URL,如果使用了隧道的话)。许多后端服务会使用看起来不熟悉的URL。比方说,docs.live.net:443实际上是微软OneDrive。

检查进程(Process)列看看是哪些应用发出给定的请求。如果你看到Explorer这个进程,那它指的是Windows Explorer(不是IE)。Windows Explorer基本上就是Windows它自己,其流量往往是Windows刷新live title的数据引起的。

缓存

网站可以在Web页面头部指定客户端缓存管理。它表明该页面是否在客户端进行缓存(而不是服务器端)。如果缓存列为空,则客户单允许缓存该页面以改进你下次浏览的显示速度。

样例数据

下面看看从我的机器抽取的一段样本数据(图1),你可以说出来好些我在做的事情了。

数据跟踪:翻滚吧!Web流量工具

图1:这里你可以找到可能产生Web流量的所有程序的视图

图1的屏幕顶部你可以看到docs.live.net:443。这是微软Word到微软OneDrive的连接,我正在用来撰写本文。Vortex.dat.microsoft.com这个条目是发送给微软用于客户体验改进计划的诊断性信息。其他的条目,你可以看到右侧Porcess列显示的是调用的方法。

Explorer的四项不是来自IE—而是来自Windows Explorer,你机器上的本地文件浏览器,它是跟Windows紧密集成的。Windows会进行一些查询来保持活动瓷片的更新(我的Windows 8安装版本是这样的)。

高亮显示表格的任意行可以看到特定请求的细节。那你可以浏览很多东西,但最有趣的是泡沫右侧的Inspectors标签。选择Inspectors,然后点击底部的WebView标签,你会看到被发送和接收信息的细节。比方说,图2显示了Sports Live Tile更新的细节。

图2:该视图允许你近距离观察共享的数据

通过Fiddler,你可以浏览本地机器产生的所有Web流量,也可以看到那些程序会送什么样的数据给母舰。

作者

Brad Irby
Brad Irby

Brad Irby has been a developer and systems architect since 1990, designing and implementing systems using the Microsoft stack.

翻译

boxi
boxi