# HG changeset patch # User amit@thunder # Date 1266935208 -19800 # Node ID 1846ab4ebddad4efb2adb3686aa7f85239487d4b # Parent ed38dd9bdb500b2b316baf2691c61e676aeee015 Bug fixes and added a script for changes in final html diff -r ed38dd9bdb50 -r 1846ab4ebdda SEESenv/scripts/finalhtml.py --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/SEESenv/scripts/finalhtml.py Tue Feb 23 19:56:48 2010 +0530 @@ -0,0 +1,45 @@ +import glob +import lxml +import re +import os +from BeautifulSoup import BeautifulSoup +import time +repo='/home/amit/testdocbook2/' + + +def finalchanges(file_name,html_string): + """some of the final changes that need to do be done on the html before creating the final usable page in the hgbook project""" +# print html_string + replace_string="""Chapter 2. Basic Python""" + reg_obj=re.compile('.*',re.DOTALL) + html_string=reg_obj.sub(replace_string, html_string,re.DOTALL) + html_string=re.sub('>','', xml_string) - xml_string=re.sub('','',xml_string) - xml_string=re.sub('','',xml_string) - xml_string=re.sub('' ,'',xml_string) - xml_string=re.sub('' ,'',xml_string) - xml_string=re.sub('' ,'',xml_string) - xml_string=re.sub('','',xml_string,) - xml_string=re.sub('','',xml_string) - xml_string=re.sub('','',xml_string) - xml_string=re.sub('','',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('
', '',xml_string) - xml_string=re.sub('', '',xml_string) - xml_string=re.sub('', '',xml_string) -# xml_string=re.sub('', '',xml_string) -# xml_string=re.sub('','', xml_string) + xml_string=re.sub('' ,'',xml_string) + xml_string=re.sub('','\n',xml_string) + xml_string=re.sub('','',xml_string) + xml_string=re.sub('','',xml_string) + xml_string=re.sub('' ,'',xml_string) + xml_string=re.sub('' ,'',xml_string) + + xml_string=re.sub('','',xml_string,) + xml_string=re.sub('','',xml_string) + xml_string=re.sub('','',xml_string) + xml_string=re.sub('','',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('
', '',xml_string) + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('', '',xml_string) + + xml_string=re.sub('', '',xml_string) + xml_string=re.sub('
', '',xml_string) + chapter= ET.Element("chapter") + article=ET.SubElement(chapter,"article") + articleinfo=ET.SubElement(article,"articleinfo") - try: - tree = ET.fromstring(xml_string) - except: - print "xml_string problem" - # print "fromstring" - try: - title= ET.SubElement(articleinfo,"title") - title.text=tree.items()[1][1] - except: - pass - article.insert(1,tree) - xml_string=ET.tostring(chapter) - xml_string=re.sub('' ,'',xml_string) - xml_string=re.sub('' ,'',xml_string) - return xml_string + try: + +# print name + tree = ET.fromstring(xml_string) + except: + pass + #print name + + # tree=ET2.fromstring(xml_string) + #print "xml_string problem" + + # print "fromstring" + try: + title= ET.SubElement(articleinfo,"title") + title_element=tree.find('title') + title.text=title_element.text + article.insert(1,tree) + except: + if name not in ('ch12index.xml',): + title= ET.SubElement(articleinfo,"title") + section_element=tree.find('section') + title_element=section_element.find('title') + title.text=title_element.text + article.insert(1,tree) + + xml_string=ET.tostring(chapter) + xml_string=xml_string.replace('\\',' ') + xml_string=re.sub('' ,'',xml_string) + xml_string=re.sub('' ,'',xml_string) +# xml_string=re.sub('' ,'',xml_string) + return xml_string @@ -97,17 +131,19 @@ if __name__=='__main__': - for name in names: - #print name - xml_string=open(name,'r').read() - #xml_string=open('ch9Using_Linux_Tools.xml','r').read() - xml_string=convert2docbook(xml_string) - docbook_file=name.split('.')[0]+'.docbook' - f=open(docbook_file,'w') - try: - f.write(xml_string) - except: - pass + + for name in names: + + #print name + #xml_string=open(name,'r').read() + xml_string=open(name,'r').read() + xml_string=convert2docbook(name,xml_string) + docbook_file=name.split('.')[0]+'.docbook' + f=open(docbook_file,'w') + try: + f.write(xml_string) + except: + pass @@ -121,3 +157,22 @@ + + + + + + + + + + + + + + + + + + +