房地产+大数据的新鲜玩法:勤智地产大数据业务介绍

房地产+大数据的新鲜玩法:勤智地产大数据业务介绍

跨界"是个近两年很火的词汇,关于跨界的营销案例、娱乐节目层出不穷。其实,做大数据应用,就是跨界的过程,将大数据技术应用于不同行业、不同领域,以挖掘出巨大的数据价值。今天,就为大家介绍下勤智数码的“跨界”合作——地产大数据业务。
大数据应用中数据收集法律风险的控制措施

大数据应用中数据收集法律风险的控制措施

大数据应用者不仅应当关注数据的抓取行为,同时应当注意数据使用的合规性,避免使用任何未经授权的个人信息、商业秘密或著作权作品。对于来源于网络平台的普通数据,企业在使用时也应当注意自身对数据的使用方式和范围,避免违反诚实信用的原则和公认的商业道德,构成不正当竞争行为。
基于Docker的OCR识别系统的诞生

基于Docker的OCR识别系统的诞生

勤智数码的人工智能应用——法官智能助力系统一经上市,就获得了广泛的关注和好评,同时间段内法院结案率提升超40%,效果显著。而它的好用性,离不开OCR识别系统的支持,才能迅速完成法院判案中证明材料、裁判文书等字符提取任务。今天,勤智数码的AI工程师景亮就来跟大家聊聊勤智的OCR识别系统。
大数据应用中数据收集不正当竞争分析

大数据应用中数据收集不正当竞争分析

如果相关数据是平台或应用运营者在运营过程中产生的数据,包括访问量、注册用户数量、用户浏览记录等一般用户无法获取的经营数据,相关运营者同时采取了保密措施(如设置防火墙、加密),则此类数据应当属于商业秘密的范畴,相关运营者应当视为商业秘密的权利人。未经商业秘密权利人同意,任何第三方不得以不正当手段获取、使用其商业秘密,否则将承担相应的民事责任或行政责任,构成犯罪的,依法追究刑事责任。
大数据应用中个人信息保护性分析

大数据应用中个人信息保护性分析

是否具有“身份可识别性”是判断信息是否属于个人信息范畴的核心要件。随着大数据技术的发展,“身份可识别性”的界限越发难以判断,并且必然会随着技术的发展而有所变化。目前我国并没有形成统一或具体的判断标准,因此实践中应当根据数据所属行业、具体的识别方法和手段合理性等因素综合判断。
针对大数据技术的选择

针对大数据技术的选择

组织机构在评估采用哪种大数据技术​时,应当考虑使用数据的目的。对于希望构建支持实时操作用途的应用程序的组织机构来说,它们需要像 MongoDB 这样的操作型数据存储。而对于需要离线执行长时间分析的组织机构来说,像 Hadoop 这样的离线解决方案可能是有效的工具。
大数据技术:操作型 vs 分析型

大数据技术:操作型 vs 分析型

大数据领域的主导技术有两类:为实时的交互式工作负载提供操作能力的系统,主要捕捉和存储数据;为复杂的回顾性分析提供分析能力的系统,可能触及大多数或所有数据。这两类技术是互补的,并且经常会一起部署。
剖析大数据平台的数据处理

剖析大数据平台的数据处理

无论是采集数据,还是存储数据,都不是大数据平台的最终目标。失去数据处理环节,即使珍贵如金矿一般的数据也不过是一堆废铁而已。数据处理是大数据产业的核心路径,然后再加上最后一公里的数据可视化,整个链条就算彻底走通了。
剖析大数据平台的数据存储

剖析大数据平台的数据存储

在对数据存储进行技术决策时,我们需要充分了解各种存储工具的优缺点,然后结合业务场景对其进行选择。就像足球教练那样,要对各个球员的技术特点了如指掌,才能将他们安排在合适的位置上。
剖析大数据平台的数据采集

剖析大数据平台的数据采集

在数据仓库的语境下,ETL基本上就是数据采集的代表,包括数据的提取(Extract)、转换(Transform)和加载(Load)。在转换的过程中,需要针对具体的业务场景对数据进行治理,例如进行非法数据监测与过滤、格式转换与数据规范化、数据替换、保证数据完整性等。