我喜欢浏览器里的猜测?网站给我看的都是我感兴趣的。如何避免大数据跟踪我的隐私?

32分钟前阅读2回复0
路人甲
路人甲
  • 管理员
  • 注册排名2
  • 经验值483615
  • 级别管理员
  • 主题96723
  • 回复0
楼主

我喜欢浏览器里的猜测?网站给我看的都是我感兴趣的。如何避免大数据跟踪我的隐私?

大数据术语的出现可以追溯到Apache开源项目Nutch。当时,大数据——Big Data——它是一个大量的数据集,用于描述需要同时批量处理或分析的更新网络搜索索引。Mapreduce和Gogle File System(GFS)自2009年以来,大数据已经成为互联网行业的流行词汇,吸引了越来越多的关注。各个角落的物联网、云计算、移动互联网、手机和平板电脑、PC和各种传感器都是大数据的来源或载体。可以说,大数据就在我们身边——从阿里巴巴、1号店、JD.COM商城等电商数据到QQ、在Google之前,MSN等即时聊天内容、Bing、百度、社交网络和微博数据都在生产和承载大数据。

随着大量数据的产生,也给数据处理和挖掘带来了很多困难,信息处理量的增加(注:据统计,Facebook搜索某个主题时,需要在50TB以上的数据中快速找到相关内容;许多传统方法(如RDBMS)存储在eBay中。、SQL查询等。)不能直接应用于海量数据的处理,否则,时间费用会变得非常大。挖掘和分析大数据变得越来越重要。挖掘和分析大数据变得越来越重要。通过Google、百度、Bing、Facebook、挖掘和分析网页文本、微博新闻等,使人们的行为和情绪细化测量成为可能。挖掘用户的行为习惯和偏好,从混乱的大数据背后找到符合用户兴趣和习惯的产品和服务,有针对性地调整和优化产品和服务,这本身就包含了巨大的商机。

NLPIR大数据语义智能分析技术由北京理工大学大数据搜索与挖掘实验室主任张华平开发,满足语法、词法和语义大数据挖掘的综合应用。NLPIR大数据语义智能分析平台是根据中文数据挖掘的综合需要,整合网络精确采集、自然语言理解、文本挖掘和语义搜索的研究成果,以及处理互联网内容的全技术链的共享开发平台。

NLPIR大数据语义智能分析平台主要包括精确收集、文档转换、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档重量、全文检索、编码转换等十多个功能模块,平台提供客户端工具、云服务和二次开发界面。各中间件API可与Windows兼容,无缝地集成到客户的各种复杂应用系统中,Linux, Android,Maemo5, Java可以使用FreBSD等不同的操作系统平台,Python,C,C#使用各种开发语言。

避无可避

除非你躲在深山老林里与世隔绝。否则,只要你在社会上活动,与人交流,你就会不可避免地留下个人信息。

0
回帖

我喜欢浏览器里的猜测?网站给我看的都是我感兴趣的。如何避免大数据跟踪我的隐私? 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息