]> git.lyx.org Git - lyx.git/blob - po/postats.py
following revert of 23068: Better fix for bug 4044
[lyx.git] / po / postats.py
1 #! /usr/bin/env python
2 # -*- coding: utf-8 -*-
3 # Copyright (C) 2007 Michael Gerz <michael.gerz@teststep.org>
4 # Copyright (C) 2007 José Matos <jamatos@lyx.org>
5 #
6 # This program is free software; you can redistribute it and/or
7 # modify it under the terms of the GNU General Public License
8 # as published by the Free Software Foundation; either version 2
9 # of the License, or (at your option) any later version.
10 #
11 # This program is distributed in the hope that it will be useful,
12 # but WITHOUT ANY WARRANTY; without even the implied warranty of
13 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14 # GNU General Public License for more details.
15 #
16 # You should have received a copy of the GNU General Public License
17 # along with this program; if not, write to the Free Software
18 # Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
19
20 """
21 This script extracts some information from the po file headers (last
22 translator, revision date), generates the corresponding gmo files
23 to retrieve the number of translated/fuzzy/untranslated messages,
24 and generates a PHP web page.
25
26 Invocation:
27    postats.py lyx_version po_files > "pathToWebPages"/i18n.inc
28 """
29
30 # modify this when you change branch
31 # Note that an empty lyx_branch variable (ie svn trunk)
32 # will "do the right thing".
33 lyx_branch=""
34
35 import os
36 import sys
37
38 # Reset the locale
39 import locale
40 locale.setlocale(locale.LC_ALL, '') 
41
42 def extract_number(line, issues, prop):
43     """
44     line is a string like
45     '588 translated messages, 1248 fuzzy translations, 2 untranslated messages.'
46     Any one of these substrings may not appear if the associated number is 0.
47
48     issues is the set of words following the number to be extracted,
49     ie, 'translated', 'fuzzy', or 'untranslated'.
50
51     extract_number returns a list with those numbers, or sets it to
52     zero if the word is not found in the string.
53     """
54
55     for issue in issues:
56         i = line.find(issue)
57
58         if i == -1:
59             prop[issue] = 0
60         else:
61             prop[issue] = int(line[:i].split()[-1])
62
63
64 def read_pofile(pofile):
65     """ Read the header of the pofile and return it as a dictionary"""
66     header = {}
67     read_header = False
68     for line in open(pofile):
69         line = line[:-1]
70         if line[:5] == 'msgid':
71             if read_header:
72                 break
73             read_header = True
74             continue
75
76         if not line or line[0] == '#' or line == 'msgstr ""' or not read_header:
77             continue
78
79         line = line.strip('"')
80         args = line.split(': ')
81         if len(args) == 1:
82             continue
83         header[args[0]] = args[1].strip()[:-2]
84
85     return header
86
87
88 def run_msgfmt(pofile):
89     """ pofile is the name of the po file.
90  The function runs msgfmt on it and returns corresponding php code.
91 """
92     if not pofile.endswith('.po'):
93         print >> sys.stderr, "%s is not a po file" % pofile
94         sys.exit(1)
95
96     dirname = os.path.dirname(pofile)
97     gmofile = pofile.replace('.po', '.gmo')
98
99     header = read_pofile(pofile)
100     charset= header['Content-Type'].split('charset=')[1]
101
102     # po file properties
103     prop = {}
104     prop["langcode"] = os.path.basename(pofile)[:-3]
105     prop["date"] = header['PO-Revision-Date'].split()[0]
106     prop["email"] = header['Last-Translator'].split('<')[1][:-1]
107     prop["email"] = prop["email"].replace("@", " () ")
108     prop["email"] = prop["email"].replace(".", " ! ")
109     translator = header['Last-Translator'].split('<')[0].strip()
110     try:
111         prop["translator"] = translator.decode(charset).encode('ascii','xmlcharrefreplace')
112     except LookupError:
113         prop["translator"] = translator
114
115     p_in, p_out = os.popen4("msgfmt --statistics -o %s %s" % (gmofile, pofile))
116     extract_number(p_out.readline(),
117                    ('translated', 'fuzzy', 'untranslated'),
118                    prop)
119     return """
120 array ( 'langcode' => '%(langcode)s', "date" => "%(date)s",
121 "msg_tr" => %(translated)d, "msg_fu" => %(fuzzy)d, "msg_nt" => %(untranslated)d,
122 "translator" => "%(translator)s", "email" => "%(email)s")""" % prop
123
124
125 if __name__ == "__main__":
126     if lyx_branch:
127         branch_tag = "branches/%s" % lyx_branch
128     else:
129         branch_tag = "trunk"
130
131
132     print """<?php
133 // The current version
134 $lyx_version = "%s";
135 // The branch tag
136 $branch_tag = "%s";
137
138 // The data itself
139 $podata = array (%s
140 )?>
141 """ % (sys.argv[1], branch_tag, ",".join([run_msgfmt(po) for po in sys.argv[2:]]))