大型广告系统架构概述 - TigerMee - CSDN博客
在互联网江湖中,始终流传着三大赚钱法宝:广告、游戏、电商。三杰之中,又以大哥广告的历史最为悠久,地位也最为不可撼动。君不见很多电商和游戏公司,也通过广告业务赚的盆满钵满。其发迹于Y公司,被G公司发扬光大,又在F公司阶段性地完成了其历史使命。F公司,在移动互联网兴起之际,利用其得天独厚的数据优势,终于能够回答困扰了广告主几百年的问题:我的广告究竟被谁看到了?浪费的一半的钱到底去了哪里?从用户角度来看,...
View Article利用yarn多队列实现hadoop资源隔离 - bbaiggey_bigdata的博客 - CSDN博客
大数据处理离不开hadoop集群的部署和管理,对于本来硬件资源就不多的创业团队来说,做好资源的共享和隔离是很有必要的,毕竟不像BAT那么豪,那么怎么样能把有限的节点同时分享给多组用户使用而且互不影响呢,我们来研究一下yarn多队列做资源隔离请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址CapacityScheduler使用过第一代hadoop的同学应该比较熟悉ma...
View Article支付网关的设计 - 凤凰牌老熊的博客 | Shamphone Blog
在支付系统中,支付网关和支付渠道的对接是最核心的功能。其中支付网关是对外提供服务的接口,所有需要渠道支持的资金操作都需要通过网关分发到对应的渠道模块上。一旦定型,后续就很少,也很难调整。而支付渠道模块是接收网关的请求,调用渠道接口执行真正的资金操作。每个渠道的接口,传输方式都不尽相同,所以在这里,支付网关相对于支付渠道模块的作用,类似设计模式中的wrapper,封装各个渠道的差异,对网关呈现统一的接...
View Article浅谈代码审计入门实战:某博客系统最新版审计之旅
第一次正式的审一次CMS,虽然只是一个很小的博客系统(提交都不一定收的那种),漏洞也都很简单,但是也算是积累了不少经验,所以最后想来还是在此做个分享,博客系统的CMS就不说了,毕竟有个官网挂着。。。缘起某日翻阅某朋友博客的时候无意间发现有个小型的CMS,反正暑假闲的无聊就去审了一下代码(正好拿来练练手),问题挺严重的,好多参数都没有进行过滤,光注入就有好多处,因为文章篇幅有限,这里就不一一列举了,这...
View Article[推荐算法]ItemCF,基于物品的协同过滤算法 - 在路上的学习者 - CSDN博客
ItemCF:ItemCollaborationFilter,基于物品的协同过滤算法核心思想:给用户推荐那些和他们之前喜欢的物品相似的物品。比如,用户A之前买过《数据挖掘导论》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。==>该算法认为,物品A和物品B具有很大的相似度是因为喜欢物品A...
View ArticleAjax上传图片以及上传之前先预览 - 江南一点雨的专栏 - CSDN博客
手头上有几个小项目用到了easyUI,一开始决定使用easyUI就注定了项目整体上前后端分离,基本上所有的请求都采用Ajax来完成。在文件上传的时候用到了Ajax上传文件,以及图片在上传之前的预览效果,解决了这两个小问题,和小伙伴们分享下。上传之前的预览方式一先来说说图片上传之前的预览问题。这里主要采用了HTML5中的FileReader对象来实现,关于FileReader对象,如果小伙伴们不了解,...
View ArticleJava程序内存分析:使用mat工具分析内存占用 - 王爵的技术博客
MAT 不是一个万能工具,它并不能处理所有类型的堆存储文件。但是比较主流的厂家和格式,例如 Sun, HP, SAP 所采用的 HPROF 二进制堆存储文件,以及 IBM 的 PHD...
View Article如何为技术博客设计一个推荐系统(中):基于 Google 搜索的半自动推荐
与统计学相比,基于内容来向用户推荐相似的内容,往往更容易获得。对于推荐来说,则有两种方式:手动推荐自动推荐手动推荐。在技术领域,作者通常比大多数读者更专业,他们往往知道什么是读者需要的。如,你看了一个 React 相关的文章,你可能会需要 Redux...
View ArticleApache Beam 快速入门(Python 版) | 张吉的博客
Apache Beam是一种大数据处理标准,由谷歌于 2016 年创建。它提供了一套统一的 DSL 用以处理离线和实时数据,并能在目前主流的大数据处理平台上使用,包括 Spark、Flink、以及谷歌自身的商业套件 Dataflow。Beam 的数据模型基于过去的几项研究成果:FlumeJava、Millwheel,适用场景包括 ETL、统计分析、实时计算等。目前,Beam 提供了两种语言的...
View Articlespring集成redis——主从配置以及哨兵监控 - 大园子 - 博客园
Redis主从模式配置:Redis的主从模式配置是非常简单的,首先我们需要有2个可运行的redis环境:master node : 192.168.56.101 8887slave node: 192.168.56.102 7777 我们只要在slave 节点的配置文件中,找到...
View ArticleGeoHash核心原理解析 - zhanlijun - 博客园
http://www.cnblogs.com/LBSer/p/3310455.html引子 机机是个好动又好学的孩子,平日里就喜欢拿着手机地图点点按按来查询一些好玩的东西。某一天机机到北海公园游玩,肚肚饿了,于是乎打开手机地图,搜索北海公园附近的餐馆,并选了其中一家用餐。...
View ArticleHTTP长连接和短连接 - WhyWin - 博客园
1. HTTP协议与TCP/IP协议的关系 HTTP的长连接和短连接本质上是TCP长连接和短连接。HTTP属于应用层协议,在传输层使用TCP协议,在网络层使用IP协议。IP协议主要解决网络路由和寻址问题,TCP协议主要解决如何在IP层之上可靠的传递数据包,使在网络上的另一端收到发端发出的所有包,并且顺序与发出顺序一致。TCP有可靠,面向连接的特点。 2. 如何理解HTTP协议是无状态的...
View ArticleSpark常用函数讲解之键值RDD转换 - MOBIN - 博客园
摘要:RDD:弹性分布式数据集,是一种特殊集合 ‚ 支持多种来源 ‚ 有容错机制 ‚ 可以被缓存 ‚ 支持并行操作,一个RDD代表一个分区里的数据集RDD有两种操作算子: Transformation(转换):Transformation属于延迟计算,当一个RDD转换成另一个RDD时并没有立即进行转换,仅仅是记住 了数据集的逻辑操作...
View Article高并发的核心技术-幂等的实现方案 - 无量的IT生活 - ITeye博客
高并发的核心技术-幂等的实现方案一、背景我们实际系统中有很多操作,是不管做多少次,都应该产生一样的效果或返回一样的结果。例如:1. 前端重复提交选中的数据,应该后台只产生对应这个数据的一个反应结果。2. 我们发起一笔付款请求,应该只扣用户账户一次钱,当遇到网络重发或系统bug重发,也应该只扣一次钱;3. 发送消息,也应该只发一次,同样的短信发给用户,用户会哭的;4....
View ArticleTextRank算法提取关键词和摘要 - 小昇的博客 | Xs Blog
提到从文本中提取关键词,我们第一想到的肯定是通过计算词语的TF-IDF值来完成,简单又粗暴。但是由于 TF-IDF 的结构过于简单,有时提取关键词的效果会很不理想。本文将介绍一个由 Google 著名的网页排序算法PageRank改编而来的算法——TextRank,它利用图模型来提取文章中的关键词。PageRankPageRank 是一种通过网页之间的超链接来计算网页重要性的技术,以 Google...
View Article聊天机器人学习 | 李强的博客
原文涉及知识人工智能一直以来是人类的梦想,造一台可以为你做一切事情并且有情感的机器人,像哆啦A梦一样,现在这已经不是一个梦了:iPhone里会说话的siri、会下棋的阿法狗、小度机器人、大白……,他们都能够具有智能,和人类交互,帮人类解决问题,这听起来非常神奇,实际上我们自己也可以做一个这样的机器人,从今天开始分享我将我学习和制作的过程智能机器人可以做到的事情可以很复杂:文字、语音、视频识别与合成;...
View Articlepython 中文文本分类 - CSDN博客
一,中文文本分类流程:1,预处理2,中文分词3,结构化表示--构建词向量空间4,权重策略--TF-IDF5,分类器6,评价二,具体细节1,预处理。希望得到这样的目标:1.1得到训练集语料库即已经分好类的文本资料(例如:语料库里是一系列txt文章,这些文章按照主题归入到不同分类的目录中,如...
View Article统计SVN代码行数工具-StatSVN - valleylord - 博客园
1. 获取SVN log:svn log -v -r 17461:39224 --xml > logfile.log2. 用StatSVN分析:java -jar ~/project/statsvn-0.7.0/statsvn.jar logfile.log <Working Copy的目录...
View Article