Merge pull request #10 from weiranyi/code-refactoring-one

第一次对代码进行重构

Merge pull request #10 from weiranyi/code-refactoring-one
第一次对代码进行重构
0661fc1d · weiranyi · GitHub · fb9f1f4d · 54d16b05 · 0661fc1d
显示空白变更内容
内联并排

Showing with 75 addition and 40 deletion

README.md README.md +5 -1

src/main/java/com/github/weiranyi/Main.java src/main/java/com/github/weiranyi/Main.java +70 -39

未找到文件。
--- a/README.md
+++ b/README.md
@@ -82,4 +82,8 @@
 - 算法
    - DFS 深度优先算法
    - BFS 广度优先
-
+- 重构
+    - 短方法：
+        - a.便于人脑理解
+        - b.越短越容易复用
+        - c.对于Java来说可以方便的对方法进行覆盖
--- a/src/main/java/com/github/weiranyi/Main.java
+++ b/src/main/java/com/github/weiranyi/Main.java
@@ -37,8 +37,33 @@ public class Main {
                continue;
            }
            // 判断是否是感兴趣滴内容【新浪站内的网页】
-            // link.contains("sina.cn") && !link.contains("passport.sina.cn") &&
-            if ((link.contains("news.sina.cn")) || "https://sina.cn".equals(link)) {
+            if (isInterestingLink(link)) {
+                Document doc = httpGetAndParseHtml(link);
+                // 使用CSS选择器,html中去获取
+                ArrayList<Element> links = doc.select("a");
+                // 用Java8引入的特性对代码进行简化，过程式语言变成描述式语言
+                links.stream().map(aTag -> aTag.attr("href")).forEach(linkPool::add);
+                // 假设这是一个新闻的详情页，就存入数据库，否则，就什么都不做
+                storeIntoDatabaseIfItIsNewsPage(doc);
+                processedLinks.add(link);
+
+            } else {
+                // 不感兴趣
+                continue;
+            }
+        }
+    }
+
+
+    /*
+     * 2、将表达不同逻辑的代码抽象为短方法
+     * 优点：
+     * a.便于人脑理解
+     * b.越短越容易复用
+     * c.对于Java来说可以方便的对方法进行覆盖
+     */
+    // 通过http请求拿到HTML文档
+    private static Document httpGetAndParseHtml(String link) throws IOException {
        try (CloseableHttpClient httpclient = HttpClients.createDefault()) {
            if (link.startsWith("//")) {
                link = "https:" + link;
@@ -50,15 +75,13 @@ public class Main {
                System.out.println(link);
                HttpEntity entity1 = response1.getEntity();
                String html = EntityUtils.toString(entity1);
-
-                        Document doc = Jsoup.parse(html);
-                        // 使用CSS选择器,html中去获取
-                        ArrayList<Element> links = doc.select("a");
-                        for (Element aTag : links) {
-                            // 获取href属性
-                            linkPool.add(aTag.attr("href"));
+                return Jsoup.parse(html);
            }
-                        // 假设这是一个新闻的详情页，就存入数据库，否则，就什么都不做
+        }
+    }
+
+    // 若是新闻页面就存到数据库中
+    private static void storeIntoDatabaseIfItIsNewsPage(Document doc) {
        ArrayList<Element> articleTags = doc.select("article");
        if (!articleTags.isEmpty()) {
            for (Element articleTag : articleTags) {
@@ -66,21 +89,29 @@ public class Main {
                System.out.println(titile);
            }
        }
-                        processedLinks.add(link);
    }
+
+    /*
+     * 1、将长的判断条件抽取为不同的方法
+     */
+    // 感兴趣的链接
+    private static boolean isInterestingLink(String link) {
+        return (isNewsPage(link) || isIndexPage(link) && isNotLoginPage(link));
    }
-            } else {
-                // 不感兴趣
-                continue;
+
+    // 首页
+    private static boolean isIndexPage(String link) {
+        return "https://sina.cn".equals(link);
    }
+
+    // 新闻页
+    private static boolean isNewsPage(String link) {
+        return link.contains("news.sina.cn");
    }
-//        try (CloseableHttpClient httpclient = HttpClients.createDefault()) {
-//            HttpGet httpGet = new HttpGet("https://sina.cn/");
-//            try (CloseableHttpResponse response1 = httpclient.execute(httpGet)) {
-//                System.out.println(response1.getStatusLine());
-//                HttpEntity entity1 = response1.getEntity();
-//                System.out.println(EntityUtils.toString(entity1));
-//            }
-//        }
+
+    // 登录页
+    private static boolean isNotLoginPage(String link) {
+        return !link.contains("passport.sina.cn");
    }
+
 }