Python 中的 SAX 解析器-解网

问：

我正在使用 Python SAX 解析器解析文件夹中的 xml 文件，并使用 pandas 在 CSV 中写入输出，但我只从 CSV 中的最后一个文件中获取数据。

我是 Python 的新手，这是第一次尝试 SAX 解析

文件读取：

for dirpath, dirs, files in os.walk(fp1): 
          for filename in files:
            print(files)
            fname = os.path.join(dirpath,filename)
            if fname.endswith('.xml'):
              print(fname)
              #for count in files:
            parser.parse(fname)

 def characters(self, content):
        rows = []
        cols = ["ReporterCite","DecisionDate","CaseName","FileNum","CourtLocation","CourtName","CourtAbbrv","Judge","CaseLength","CourtCite","ParallelCite","CitedCount","UCN"]
        #ReporteCite, DecisionDate, CaseName, FileNum, CourtLocation, CourtName, CourtAbbrv, Judge, CaseLength, CourtCite, ParallelCite, CitedCount, UCN             

        rows.append({"ReporterCite":self.rc,
                     "DecisionDate": self.dd,
                     "CaseName": self.can,
                     "FileNum": self.fn,
                     "CourtLocation": self.loc,
                     "CourtName": self.cn,
                     "CourtAbbrv": self.ca,
                     "Judge": self.j,   
                     "CaseLength": self.cl,
                     "CourtCite": self.cc,
                     "ParallelCite": self.pc,
                     "CitedCount": self.cd,
                     "UCN": self.rn})

        #print(rows)
        df = pd.DataFrame(rows, columns=cols)
        df.to_csv(fp2,index=False)

Python Pandas DataFrame XML 解析 SAX

Python 中的 SAX 解析器

SAX Parser in Python

评论

评论