csp_XPath套娃规则 (2).txt 5.9 KB


  1. ublic class XPathRule {
  2. /**
  3. * user-agent
  4. */
  5. private String ua;
  6. /**
  7. * 获取分类和首页推荐的Url
  8. */
  9. private String homeUrl;
  10. /**
  11. * 分类节点 xpath
  12. */
  13. private String cateNode;
  14. /**
  15. * 分类节点名 xpath
  16. */
  17. private String cateName;
  18. /**
  19. * 正则对取到的数据进行二次处理
  20. */
  21. private Pattern cateNameR;
  22. /**
  23. * 分类节点id xpath
  24. */
  25. private String cateId;
  26. /**
  27. * 正则对取到的数据进行二次处理
  28. */
  29. private Pattern cateIdR;
  30. /**
  31. * 手动指定 分类 如果有则不从homeUrl中获取分类
  32. */
  33. private LinkedHashMap<String, String> cateManual = new LinkedHashMap<>();
  34. /**
  35. * 更新推荐视频节点 xpath
  36. */
  37. private String homeVodNode;
  38. /**
  39. * 更新推荐视频名称 xpath
  40. */
  41. private String homeVodName;
  42. /**
  43. * 正则对取到的数据进行二次处理
  44. */
  45. private Pattern homeVodNameR;
  46. /**
  47. * 更新推荐视频id xpath
  48. */
  49. private String homeVodId;
  50. /**
  51. * 正则对取到的数据进行二次处理
  52. */
  53. private Pattern homeVodIdR;
  54. /**
  55. * 更新推荐视频图片 xpath
  56. */
  57. private String homeVodImg;
  58. /**
  59. * 正则对取到的数据进行二次处理
  60. */
  61. private Pattern homeVodImgR;
  62. /**
  63. * 更新推荐视频简介 xpath
  64. */
  65. private String homeVodMark;
  66. /**
  67. * 正则对取到的数据进行二次处理
  68. */
  69. private Pattern homeVodMarkR;
  70. /**
  71. * 分类页地址
  72. */
  73. private String cateUrl;
  74. /**
  75. * 分类叶视频节点 xpath
  76. */
  77. private String cateVodNode;
  78. /**
  79. * 分类叶视频名称 xpath
  80. */
  81. private String cateVodName;
  82. /**
  83. * 正则对取到的数据进行二次处理
  84. */
  85. private Pattern cateVodNameR;
  86. /**
  87. * 分类叶视频视频id xpath
  88. */
  89. private String cateVodId;
  90. /**
  91. * 正则对取到的数据进行二次处理
  92. */
  93. private Pattern cateVodIdR;
  94. /**
  95. * 分类叶视频视频图片 xpath
  96. */
  97. private String cateVodImg;
  98. /**
  99. * 正则对取到的数据进行二次处理
  100. */
  101. private Pattern cateVodImgR;
  102. /**
  103. * 分类叶视频视频简介 xpath
  104. */
  105. private String cateVodMark;
  106. /**
  107. * 正则对取到的数据进行二次处理
  108. */
  109. private Pattern cateVodMarkR;
  110. /**
  111. * 详情页面
  112. */
  113. private String dtUrl;
  114. /**
  115. * 详情节点 xpath
  116. */
  117. private String dtNode;
  118. /**
  119. * 详情 视频名 xpath
  120. */
  121. private String dtName;
  122. /**
  123. * 正则对取到的数据进行二次处理
  124. */
  125. private Pattern dtNameR;
  126. /**
  127. * 详情视频图片 xpath
  128. */
  129. private String dtImg;
  130. /**
  131. * 正则对取到的数据进行二次处理
  132. */
  133. private Pattern dtImgR;
  134. /**
  135. * 详情视频分类 xpath
  136. */
  137. private String dtCate;
  138. /**
  139. * 正则对取到的数据进行二次处理
  140. */
  141. private Pattern dtCateR;
  142. /**
  143. * 详情视频年份 xpath
  144. */
  145. private String dtYear;
  146. /**
  147. * 正则对取到的数据进行二次处理
  148. */
  149. private Pattern dtYearR;
  150. /**
  151. * 详情视频地区 xpath
  152. */
  153. private String dtArea;
  154. /**
  155. * 正则对取到的数据进行二次处理
  156. */
  157. private Pattern dtAreaR;
  158. /**
  159. * 详情视频简介 xpath
  160. */
  161. private String dtMark;
  162. /**
  163. * 正则对取到的数据进行二次处理
  164. */
  165. private Pattern dtMarkR;
  166. /**
  167. * 详情演员 xpath
  168. */
  169. private String dtActor;
  170. /**
  171. * 正则对取到的数据进行二次处理
  172. */
  173. private Pattern dtActorR;
  174. /**
  175. * 详情导演 xpath
  176. */
  177. private String dtDirector;
  178. /**
  179. * 正则对取到的数据进行二次处理
  180. */
  181. private Pattern dtDirectorR;
  182. /**
  183. * 详情 说明 长 xpath
  184. */
  185. private String dtDesc;
  186. /**
  187. * 正则对取到的数据进行二次处理
  188. */
  189. private Pattern dtDescR;
  190. /**
  191. * 详情播放来源节点
  192. */
  193. private String dtFromNode;
  194. /**
  195. * 详情播放来源名称 xpath
  196. */
  197. private String dtFromName;
  198. /**
  199. * 详情
  200. */
  201. private Pattern dtFromNameR;
  202. /**
  203. * 详情播放地址列表节点 xpath
  204. */
  205. private String dtUrlNode;
  206. /**
  207. * 详情播放地址节点 xpath
  208. */
  209. private String dtUrlSubNode;
  210. /**
  211. * 详情播放地址id xpath
  212. */
  213. private String dtUrlId;
  214. /**
  215. * 详情
  216. */
  217. private Pattern dtUrlIdR;
  218. /**
  219. * 详情播放地址名称 xpath
  220. */
  221. private String dtUrlName;
  222. /**
  223. * 详情
  224. */
  225. private Pattern dtUrlNameR;
  226. /**
  227. * 播放页面url
  228. */
  229. private String playUrl;
  230. /**
  231. * 播放解析调用ua
  232. */
  233. private String playUa;
  234. /**
  235. * 搜索页地址
  236. */
  237. private String searchUrl;
  238. /**
  239. * 搜索页视频节点 xpath
  240. */
  241. private String scVodNode;
  242. /**
  243. * 搜索页视频名称 xpath
  244. */
  245. private String scVodName;
  246. /**
  247. * 正则对取到的数据进行二次处理
  248. */
  249. private Pattern scVodNameR;
  250. /**
  251. * 搜索页视频id xpath
  252. */
  253. private String scVodId;
  254. /**
  255. * 正则对取到的数据进行二次处理
  256. */
  257. private Pattern scVodIdR;
  258. /**
  259. * 搜索页视频图片 xpath
  260. */
  261. private String scVodImg;
  262. /**
  263. * 正则对取到的数据进行二次处理
  264. */
  265. private Pattern scVodImgR;
  266. /**
  267. * 搜索页视频简介 xpath
  268. */
  269. private String scVodMark;
  270. /**
  271. * 正则对取到的数据进行二次处理
  272. */
  273. private Pattern scVodMarkR;