bib2html.py: Add umlaut replacement
[shutils.git] / bib2html.py
index 28abd58ecbfebd88bfcdc56099a1a33619139f13..5d5b4db16f6e75bbd796858d792714130052a614 100755 (executable)
@@ -1,7 +1,7 @@
-#!/usr/bin/env python2
+#!/usr/bin/env python3
 """Creates a webpage with all entries of a .bib file"""
 
-__version__ = "1.0"
+__version__ = "1.1"
 
 __author__ = "Stefan Huber"
 __email__ = "shuber@sthu.org"
@@ -31,22 +31,43 @@ __license__ = "MIT"
 # OTHER DEALINGS IN THE SOFTWARE.
 
 
-import os, sys, getopt
+import os, sys, getopt, re
 
 
 def format_latex(text):
-    return text.replace('{', '').replace('}', '').replace('\\', '')
+    # Get rid of matching dollar signs
+    text = re.sub(r'\$([^\$]*)\$', r'\1', text)
+
+    # Replace text
+    subst = {
+        '\\"a': 'ä',
+        '\\"o': 'ö',
+        '\\"u': 'u',
+        '\mathcal': '',
+        '{': '',
+        '}': '',
+        '\\': '',
+        '~': ' ',
+        '---': '–',
+        '--': '–',
+    }
+
+    for a, b in subst.items():
+        text = text.replace(a, b)
+
+    return text
 
 def format_field_span(type, value):
     return "<span class=bibentry_" + type + ">" + format_latex(value) + "</span>"
 
 def format_field(bibentry, field, pre='', post=''):
     if field in bibentry.fields:
-        return format_field_span(field, pre + bibentry.fields[field] + post)
+        if bibentry.fields[field] != "":
+            return format_field_span(field, pre + bibentry.fields[field] + post)
     return ""
 
 def format_author(a):
-    return  ' '.join(' '.join(p) for p in (a.first(), a.middle(), a.prelast(), a.last(), a.lineage()) if p)
+    return  ' '.join(' '.join(p) for p in (a.first_names, a.middle_names, a.prelast_names, a.last_names, a.lineage_names) if p)
 
 def format_authors(entry):
     return ", ".join([format_author(a) for a in entry.persons['author']])
@@ -62,8 +83,9 @@ def format_details_article(entry):
             format_field(entry, 'number', pre='(', post=')'))
     line.append(format_field(entry, 'month', post=' ') + \
             format_field(entry, 'year'))
-    line = filter(lambda l: l != "", line)
+    line.append(format_field(entry, 'note'))
 
+    line = filter(lambda l: l != "", line)
     return [where, ", ".join(line)]
 
 def format_details_inproceedings(entry):
@@ -74,6 +96,9 @@ def format_details_inproceedings(entry):
     line.append(format_field(entry, 'address'))
     line.append(format_field(entry, 'month', post=' ') + \
             format_field(entry, 'year'))
+    line.append(format_field(entry, 'isbn', pre='ISBN '))
+    line.append(format_field(entry, 'note'))
+
     line = filter(lambda l: l != "", line)
     return [where, ", ".join(line)]
 
@@ -82,6 +107,8 @@ def format_details_thesis(entry):
     line.append(format_field(entry, 'school'))
     line.append(format_field(entry, 'month', post=' ') + \
             format_field(entry, 'year'))
+    line.append(format_field(entry, 'note'))
+
     line = filter(lambda l: l != "", line)
     return [", ".join(line)]
 
@@ -91,16 +118,20 @@ def format_details_book(entry):
     line.append(format_field(entry, 'isbn', pre='ISBN '))
     line.append(format_field(entry, 'month', post=' ') + \
             format_field(entry, 'year'))
+    line.append(format_field(entry, 'note'))
+
     line = filter(lambda l: l != "", line)
     return [", ".join(line)]
 
 def format_links(entry):
+    doi = format_field(entry, 'doi', pre='<a href="http://dx.doi.org/', post='">[DOI]</a>')
     webpdf = format_field(entry, 'webpdf', pre='<a href="', post='">[PDF]</a>')
     weblink = format_field(entry, 'weblink', pre='<a href="', post='">[link]</a>')
+    url = format_field(entry, 'url', pre='<a href="', post='">[url]</a>')
     webslides = format_field(entry, 'webslides', pre='<a href="', post='">[slides]</a>')
     weberrata = format_field(entry, 'weberrata', pre='<a href="',
             post='">[errata]</a>')
-    return " ".join([webpdf, weblink, webslides, weberrata])
+    return " ".join([doi, webpdf, weblink, url, webslides, weberrata])
 
 def format_entry(entry):
     lines = []
@@ -125,19 +156,24 @@ def format_entry(entry):
     return "<br/>\n".join(lines)
 
 
-def entryCompareDate(p1, p2):
-    k1, e1 = p1
-    k2, e2 = p2
+def entryDateSortKey(p):
+    k, e = p
 
+    month2num = { 'jan' : '01', 'feb' : '02', 'mar' : '03', \
+            'apr' : '04', 'may' : '05', 'jun' : '06', \
+            'jul' : '07', 'aug' : '08', 'sep' : '09', \
+            'oct' : '10', 'nov' : '11', 'dec' : '12'}
 
-    def toStr(e):
-        month = { 'jan' : '01', 'feb' : '02', 'mar' : '03', \
-                'apr' : '04', 'may' : '05', 'jun' : '06', \
-                'jul' : '07', 'aug' : '08', 'sep' : '09', \
-                'oct' : '10', 'nov' : '11', 'dec' : '12'}
-        return e.fields['year'] + "-" + month[e.fields['month'].lower()[0:3]]
+    if not 'month' in e.fields:
+        return e.fields['year']
+
+    month = e.fields['month'].lower()[0:3]
+    if month in month2num:
+        month = month2num[month]
+    else:
+        month = ""
 
-    return cmp(toStr(e1), toStr(e2))
+    return e.fields['year'] + "-" + month
 
 
 def usage():
@@ -193,8 +229,8 @@ if __name__ == "__main__":
 
         print("<h2>" + year + "</h2>")
 
-        iteritems = list(entries.iteritems())
-        iteritems.sort(cmp=entryCompareDate, reverse=True)
+        iteritems = list(entries.items())
+        iteritems.sort(key=entryDateSortKey, reverse=True)
         for key, entry in iteritems:
 
             if entry.fields['year'] != year:
@@ -203,7 +239,8 @@ if __name__ == "__main__":
             print("<div class=bibentry>")
             print("<a class=bibentry_key id=" + key + ">[" + key + "]</a><br/>")
 
-            print(format_entry(entry).encode('utf8'))
+            e = format_entry(entry)
+            print(e)
 
             print("</div>\n")