# HG changeset patch
# User amit@thunder
# Date 1266935208 -19800
# Node ID 1846ab4ebddad4efb2adb3686aa7f85239487d4b
# Parent ed38dd9bdb500b2b316baf2691c61e676aeee015
Bug fixes and added a script for changes in final html
diff -r ed38dd9bdb50 -r 1846ab4ebdda SEESenv/scripts/finalhtml.py
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/SEESenv/scripts/finalhtml.py Tue Feb 23 19:56:48 2010 +0530
@@ -0,0 +1,45 @@
+import glob
+import lxml
+import re
+import os
+from BeautifulSoup import BeautifulSoup
+import time
+repo='/home/amit/testdocbook2/'
+
+
+def finalchanges(file_name,html_string):
+ """some of the final changes that need to do be done on the html before creating the final usable page in the hgbook project"""
+# print html_string
+ replace_string="""
Chapter 2. Basic Python """
+ reg_obj=re.compile('.*',re.DOTALL)
+ html_string=reg_obj.sub(replace_string, html_string,re.DOTALL)
+ html_string=re.sub('>','', xml_string)
- xml_string=re.sub('','',xml_string)
- xml_string=re.sub(' ','',xml_string)
- xml_string=re.sub('' ,'',xml_string)
- xml_string=re.sub(' ' ,'',xml_string)
- xml_string=re.sub('' ,' ',xml_string)
- xml_string=re.sub('','',xml_string,)
- xml_string=re.sub(' ','',xml_string)
- xml_string=re.sub('','',xml_string)
- xml_string=re.sub(' ','',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub('
', '',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
- xml_string=re.sub('
', '',xml_string)
- xml_string=re.sub('', '',xml_string)
- xml_string=re.sub(' ', '',xml_string)
-# xml_string=re.sub(' ', '',xml_string)
-# xml_string=re.sub(' ','', xml_string)
+ xml_string=re.sub('' ,' ',xml_string)
+ xml_string=re.sub('','\n',xml_string)
+ xml_string=re.sub('','',xml_string)
+ xml_string=re.sub(' ','',xml_string)
+ xml_string=re.sub('' ,'',xml_string)
+ xml_string=re.sub(' ' ,'',xml_string)
+
+ xml_string=re.sub('','',xml_string,)
+ xml_string=re.sub(' ','',xml_string)
+ xml_string=re.sub('','',xml_string)
+ xml_string=re.sub(' ','',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', ' ',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub('
', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub('
', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ xml_string=re.sub(' ', '',xml_string)
+
+ xml_string=re.sub(' ', '',xml_string)
+ xml_string=re.sub('', '',xml_string)
+ chapter= ET.Element("chapter")
+ article=ET.SubElement(chapter,"article")
+ articleinfo=ET.SubElement(article,"articleinfo")
- try:
- tree = ET.fromstring(xml_string)
- except:
- print "xml_string problem"
- # print "fromstring"
- try:
- title= ET.SubElement(articleinfo,"title")
- title.text=tree.items()[1][1]
- except:
- pass
- article.insert(1,tree)
- xml_string=ET.tostring(chapter)
- xml_string=re.sub('' ,'',xml_string)
- xml_string=re.sub(' ' ,'',xml_string)
- return xml_string
+ try:
+
+# print name
+ tree = ET.fromstring(xml_string)
+ except:
+ pass
+ #print name
+
+ # tree=ET2.fromstring(xml_string)
+ #print "xml_string problem"
+
+ # print "fromstring"
+ try:
+ title= ET.SubElement(articleinfo,"title")
+ title_element=tree.find('title')
+ title.text=title_element.text
+ article.insert(1,tree)
+ except:
+ if name not in ('ch12index.xml',):
+ title= ET.SubElement(articleinfo,"title")
+ section_element=tree.find('section')
+ title_element=section_element.find('title')
+ title.text=title_element.text
+ article.insert(1,tree)
+
+ xml_string=ET.tostring(chapter)
+ xml_string=xml_string.replace('\\',' ')
+ xml_string=re.sub('' ,'',xml_string)
+ xml_string=re.sub(' ' ,'',xml_string)
+# xml_string=re.sub('' ,'',xml_string)
+ return xml_string
@@ -97,17 +131,19 @@
if __name__=='__main__':
- for name in names:
- #print name
- xml_string=open(name,'r').read()
- #xml_string=open('ch9Using_Linux_Tools.xml','r').read()
- xml_string=convert2docbook(xml_string)
- docbook_file=name.split('.')[0]+'.docbook'
- f=open(docbook_file,'w')
- try:
- f.write(xml_string)
- except:
- pass
+
+ for name in names:
+
+ #print name
+ #xml_string=open(name,'r').read()
+ xml_string=open(name,'r').read()
+ xml_string=convert2docbook(name,xml_string)
+ docbook_file=name.split('.')[0]+'.docbook'
+ f=open(docbook_file,'w')
+ try:
+ f.write(xml_string)
+ except:
+ pass
@@ -121,3 +157,22 @@
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+