rename economic and add EPU

2022-01-27 12:00:23 +08:00 · 2022-01-27 12:00:23 +08:00 · afffa95df1
parent b1fe6e03a3
commit afffa95df1
9 changed files with 86 additions and 0 deletions
--- a/.vscode/settings.json
+++ b/.vscode/settings.json
@ -0,0 +1,3 @@
+{
+    "python.formatting.provider": "yapf"
+}
--- a/CEDA/macroecon/BOJData.py
+++ b/CEDA/macroecon/BOJData.py
--- a/CEDA/macroecon/ECBData.py
+++ b/CEDA/macroecon/ECBData.py
--- a/CEDA/economic/EPU.py
+++ b/CEDA/economic/EPU.py
@ -0,0 +1,83 @@
+from lxml import html
+import requests
+import pandas as pd
+
+url = {
+    "EPU-China": "https://economicpolicyuncertaintyinchina.weebly.com",
+    "EPU-HKSAR": "https://economicpolicyuncertaintyinchina.weebly.com/epu-in-hong-kong.html",
+    "EPU-MACAUSAR": "https://economicpolicyuncertaintyinchina.weebly.com/epu-in-macao.html",
+    "EPU": "https://www.policyuncertainty.com/"
+}
+
+
+class EPUData(object):
+    def __init__(self, country:str=None):
+        self.country = country
+
+    def country_list(self):
+        country_list = ["Global", "USA", "Australia", "Belgium", 
+                "Brazil", "Canada", "Chile", "China", 
+                "Colombia", "Croatia", "Denmark", "France", 
+                "Germany", "Greece", "HKSAR", "MACAUSAR", 
+                "India", "Ireland", "Italy", "Japan", 
+                "Korea", "Mexico", "Netherlands", "Pakistan", 
+                "Russia", "Singapore", "Spain", "Sweden", "UK"]
+        annotations = "Disambiguation: the word 'Korea' in here stands for 'South Korea'"
+        return country_list, annotations
+    
+    def download(self):
+        if self.country == "China":
+            r = requests.get(url["EPU-China"])
+            webpage = html.fromstring(r.content)
+            urls = pd.Series(webpage.xpath("//a/@href"))
+            urls_data = urls[urls.str.contains("xlsx")]
+            urls_cite = urls[urls.str.contains("pdf")]
+            urls_data = [url["EPU-China"] + i for i in urls_data]
+            urls_cite = [url["EPU-China"] + i for i in urls_cite]
+            output_data = []
+            for i in range(0, len(urls_data)):
+                output_data.append(pd.read_excel(urls_data[i]))
+            
+            return {"data":output_data, "reference":urls_cite}
+
+        elif self.country == "HKSAR":
+            r = requests.get(url["EPU-HKSAR"])
+            webpage = html.fromstring(r.content)
+            urls = pd.Series(webpage.xpath("//a/@href"))
+            urls_data = urls[urls.str.contains("xlsx")]
+            urls_cite = urls[urls.str.contains("pdf")]
+            urls_data = [url["EPU-China"] + i for i in urls_data]
+            urls_cite = [url["EPU-China"] + i for i in urls_cite]
+            output_data = []
+            for i in range(0, len(urls_data)):
+                output_data.append(pd.read_excel(urls_data[i]))
+            
+            return {"data":output_data, "reference":urls_cite}
+
+        elif self.country == "MACAUSAR":
+            r = requests.get(url["EPU-MACAUSAR"])
+            webpage = html.fromstring(r.content)
+            urls = pd.Series(webpage.xpath("//a/@href"))
+            urls_data = urls[urls.str.contains("xlsx")]
+            urls_cite = urls[urls.str.contains("pdf")]
+            urls_data = [url["EPU-China"] + i for i in urls_data]
+            urls_cite = [url["EPU-China"] + i for i in urls_cite]
+            output_data = []
+            for i in range(0, len(urls_data)):
+                output_data.append(pd.read_excel(urls_data[i]))
+            
+            return {"data":output_data, "reference":urls_cite}
+        
+        else:
+            r = requests.get(url["EPU"] + self.country.lower() + "_monthly.html")
+            webpage = html.fromstring(r.content)
+            urls = pd.Series(webpage.xpath("//a/@href"))
+            urls_data = urls[urls.str.contains("xlsx")]
+            urls_cite = urls[urls.str.contains("pdf")]
+            urls_data = [url["EPU"] + i for i in urls_data]
+            urls_cite = [url["EPU"] + i for i in urls_cite]
+            output_data = []
+            for i in range(0, len(urls_data)):
+                output_data.append(pd.read_excel(urls_data[i]))
+            
+            return {"data":output_data, "reference":urls_cite}
--- a/CEDA/macroecon/EurostatData.py
+++ b/CEDA/macroecon/EurostatData.py
--- a/CEDA/macroecon/FredData.py
+++ b/CEDA/macroecon/FredData.py
--- a/CEDA/macroecon/OECD.py
+++ b/CEDA/macroecon/OECD.py
--- a/CEDA/macroecon/init.py
+++ b/CEDA/macroecon/init.py
--- a/CEDA/macroecon/cn.py
+++ b/CEDA/macroecon/cn.py