]> git.lyx.org Git - lyx.git/blob - src/support/lstrings.h
89450c706ffc4268323ff309a9542d56d6ca2365
[lyx.git] / src / support / lstrings.h
1 // -*- C++ -*-
2 /**
3  * \file lstrings.h
4  * This file is part of LyX, the document processor.
5  * Licence details can be found in the file COPYING.
6  *
7  * \author Lars Gullik Bjønnes
8  * \author Jean-Marc Lasgouttes
9  *
10  * Full author contact details are available in file CREDITS.
11  *
12  * A collection of string helper functions that works with string.
13  * Some of these would certainly benefit from a rewrite/optimization.
14  */
15
16 #ifndef LSTRINGS_H
17 #define LSTRINGS_H
18
19 #include "support/docstring.h"
20
21 #include <vector>
22
23
24 namespace lyx {
25 namespace support {
26
27 /// Compare \p s and \p s2, ignoring the case.
28 /// Does not depend on the locale.
29 int compare_no_case(docstring const & s, docstring const & s2);
30
31 /// Compare \p s and \p s2, ignoring the case of ASCII characters only.
32 int compare_ascii_no_case(std::string const & s, std::string const & s2);
33
34 /// Compare \p s and \p s2, ignoring the case of ASCII characters only.
35 int compare_ascii_no_case(docstring const & s, docstring const & s2);
36
37 ///
38 bool isStrInt(std::string const & str);
39
40 /// does the std::string represent an unsigned integer value ?
41 bool isStrUnsignedInt(std::string const & str);
42
43 ///
44 bool isStrDbl(std::string const & str);
45
46 /// does the string contain a digit?
47 bool hasDigitASCII(docstring const & str);
48
49 bool isHexChar(char_type);
50
51 bool isHex(docstring const & str);
52
53 int hexToInt(docstring const & str);
54
55 /// is \p str pure ascii?
56 bool isAscii(docstring const & str);
57
58 /// is \p str pure ascii?
59 bool isAscii(std::string const & str);
60
61 /**
62  * Changes the case of \p c to lowercase.
63  * Don't use this for non-ASCII characters, since it depends on the locale.
64  * This overloaded function is only implemented because the char_type variant
65  * would be used otherwise, and we assert in this function that \p c is in
66  * the ASCII range.
67  */
68 char lowercase(char c);
69
70 /**
71  * Changes the case of \p c to uppercase.
72  * Don't use this for non-ASCII characters, since it depends on the locale.
73  * This overloaded function is only implemented because the char_type variant
74  * would be used otherwise, and we assert in this function that \p c is in
75  * the ASCII range.
76  */
77 char uppercase(char c);
78
79 /// Changes the case of \p c to lowercase.
80 /// Does not depend on the locale.
81 char_type lowercase(char_type c);
82
83 /// Changes the case of \p c to uppercase.
84 /// Does not depend on the locale.
85 char_type uppercase(char_type c);
86
87 /// Checks if the supplied character is lower-case
88 bool isLowerCase(char_type ch);
89
90 /// Checks if the supplied character is upper-case
91 bool isUpperCase(char_type ch);
92
93 /// same as lowercase(), but ignores locale
94 std::string const ascii_lowercase(std::string const &);
95 docstring const ascii_lowercase(docstring const &);
96
97 /// Changes the case of \p s to lowercase.
98 /// Does not depend on the locale.
99 std::string const lowercase(std::string const & s);
100 docstring const lowercase(docstring const & s);
101
102 /// Changes the case of \p s to uppercase.
103 /// Does not depend on the locale.
104 docstring const uppercase(docstring const & s);
105
106 /// Returns the superscript of \p c or \p c if no superscript exists.
107 /// Does not depend on the locale.
108 char_type superscript(char_type c);
109
110 /// Returns the subscript of \p c or \p c if no subscript exists.
111 /// Does not depend on the locale.
112 char_type subscript(char_type c);
113
114 /// Does str start with c?
115 bool prefixIs(docstring const & str, char_type c);
116
117 /// Does str start with pre?
118 bool prefixIs(std::string const & str, std::string const & pre);
119 bool prefixIs(docstring const & str, docstring const & pre);
120
121 /// Does the string end with this char?
122 bool suffixIs(std::string const &, char);
123 bool suffixIs(docstring const &, char_type);
124
125 /// Does the string end with this suffix?
126 bool suffixIs(std::string const &, std::string const &);
127 bool suffixIs(docstring const &, docstring const &);
128
129 /// Is b contained in a?
130 inline bool contains(std::string const & a, std::string const & b)
131 {
132         return a.find(b) != std::string::npos;
133 }
134
135 inline bool contains(docstring const & a, docstring const & b)
136 {
137         return a.find(b) != docstring::npos;
138 }
139
140 inline bool contains(std::string const & a, char b)
141 {
142         return a.find(b) != std::string::npos;
143 }
144
145 inline bool contains(docstring const & a, char_type b)
146 {
147         return a.find(b) != docstring::npos;
148 }
149
150 ///
151 bool containsOnly(std::string const &, std::string const &);
152
153 /** Extracts a token from this string at the nth delim.
154     Doesn't modify the original string. Similar to strtok.
155     Example:
156     \code
157     token("a;bc;d", ';', 1) == "bc";
158     token("a;bc;d", ';', 2) == "d";
159     \endcode
160 */
161 std::string const token(std::string const & a, char delim, int n);
162
163 docstring const token(docstring const & a, char_type delim, int n);
164
165 /** Search a token in this string using the delim.
166     Doesn't modify the original string. Returns -1 in case of
167     failure.
168     Example:
169     \code
170     tokenPos("a;bc;d", ';', "bc") == 1;
171     tokenPos("a;bc;d", ';', "d") == 2;
172     \endcode
173 */
174 int tokenPos(std::string const & a, char delim, std::string const & tok);
175 int tokenPos(docstring const & a, char_type delim, docstring const & tok);
176
177
178 /// Substitute all \a oldchar with \a newchar
179 std::string const subst(std::string const & a, char oldchar, char newchar);
180
181 /// Substitute all \a oldchar with \a newchar
182 docstring const subst(docstring const & a, char_type oldchar, char_type newchar);
183
184 /// substitutes all instances of \a oldstr with \a newstr
185 std::string const subst(std::string const & a,
186                    std::string const & oldstr, std::string const & newstr);
187
188 /// substitutes all instances of \a oldstr with \a newstr
189 docstring const subst(docstring const & a,
190                 docstring const & oldstr, docstring const & newstr);
191
192 /// Count all occurences of char \a chr inside \a str
193 int count_char(std::string const & str, char chr);
194
195 /// Count all occurences of char \a chr inside \a str
196 int count_char(docstring const & str, docstring::value_type chr);
197
198 /** Trims characters off the end and beginning of a string.
199     \code
200     trim("ccabccc", "c") == "ab".
201     \endcode
202 */
203 docstring const trim(docstring const & a, char const * p = " ");
204
205 /** Trims characters off the end and beginning of a string.
206     \code
207     trim("ccabccc", "c") == "ab".
208     \endcode
209 */
210 std::string const trim(std::string const & a, char const * p = " ");
211
212 /** Trims characters off the end of a string, removing any character
213     in p.
214     \code
215     rtrim("abcde", "dec") == "ab".
216     \endcode
217 */
218 std::string const rtrim(std::string const & a, char const * p = " ");
219 docstring const rtrim(docstring const & a, char const * p = " ");
220
221 /** Trims characters off the beginning of a string.
222     \code
223    ("abbabcdef", "ab") = "cdef"
224     \endcode
225 */
226 std::string const ltrim(std::string const & a, char const * p = " ");
227 docstring const ltrim(docstring const & a, char const * p = " ");
228
229 /** Splits the string given in the first argument at the first occurence 
230     of the third argument, delim.
231     What precedes delim is returned in the second argument, piece; this
232     will be the whole of the string if no delimiter is found.
233     The return value is what follows delim, if anything. So the return
234     value is the null string if no delimiter is found.
235     'a' and 'piece' must be different variables.
236     Examples:
237     \code
238     s1= "a;bc"; s2= ""
239     ret = split(s1, s2, ';') -> ret = "bc", s2 == "a"
240     \endcode
241  */
242 std::string const split(std::string const & a, std::string & piece, char delim);
243 docstring const split(docstring const & a, docstring & piece, char_type delim);
244
245 /// Same as split but does not return a piece
246 std::string const split(std::string const & a, char delim);
247
248 /// Same as split but uses the last delim.
249 std::string const rsplit(std::string const & a, std::string & piece, char delim);
250 docstring const rsplit(docstring const & a, docstring & piece, char_type delim);
251 docstring const rsplit(docstring const & a, char_type delim);
252
253 /// Escapes non ASCII chars and other problematic characters that cause
254 /// problems in latex labels.
255 docstring const escape(docstring const & lab);
256
257 /// Word-wraps the provided docstring, returning a line-broken string
258 /// of width no wider than width, with the string broken at spaces. 
259 /// If the string cannot be broken appropriately, it returns something 
260 /// with "..." at the end, again no wider than width.
261 /// We assume here that str does not contain newlines.
262 /// If indent is positive, then the first line is indented that many 
263 /// spaces. If it is negative, then successive lines are indented, as
264 /// if the first line were "outdented".
265 docstring wrap(docstring const & str, int const indent = 0,
266                size_t const width = 80);
267
268 /// Like the preceding, except it is intended to operate on strings
269 /// that may contain embedded newlines.
270 /// \param numlines Don't return more than numlines lines. If numlines
271 ///    is 0, we return everything.
272 docstring wrapParas(docstring const & str, int const indent = 0,
273                     size_t const width = 80, size_t const maxlines = 10);
274
275 /// gives a vector of stringparts which have the delimiter delim
276 /// If \p keepempty is true, empty strings will be pushed to the vector as well
277 std::vector<std::string> const getVectorFromString(std::string const & str,
278                                               std::string const & delim = std::string(","),
279                                               bool keepempty = false);
280 std::vector<docstring> const getVectorFromString(docstring const & str,
281                 docstring const & delim = from_ascii(","), bool keepempty = false);
282
283 /// the same vice versa
284 std::string const getStringFromVector(std::vector<std::string> const & vec,
285                                  std::string const & delim = std::string(","));
286 docstring const getStringFromVector(std::vector<docstring> const & vec,
287                                  docstring const & delim = from_ascii(","));
288
289 /// Search \p search_token in \p str and return the position if it is
290 /// found, else -1. The last item in \p str must be "".
291 int findToken(char const * const str[], std::string const & search_token);
292
293 template <class Arg1>
294 docstring bformat(docstring const & fmt, Arg1);
295
296 template <class Arg1, class Arg2>
297 docstring bformat(docstring const & fmt, Arg1, Arg2);
298
299 template <class Arg1, class Arg2, class Arg3>
300 docstring bformat(docstring const & fmt, Arg1, Arg2, Arg3);
301
302 template <class Arg1, class Arg2, class Arg3, class Arg4>
303 docstring bformat(docstring const & fmt, Arg1, Arg2, Arg3, Arg4);
304
305
306 template<> docstring bformat(docstring const & fmt, int arg1);
307 template<> docstring bformat(docstring const & fmt, long arg1);
308 template<> docstring bformat(docstring const & fmt, unsigned int arg1);
309 template<> docstring bformat(docstring const & fmt, docstring arg1);
310 template<> docstring bformat(docstring const & fmt, char * arg1);
311 template<> docstring bformat(docstring const & fmt, docstring arg1, docstring arg2);
312 template<> docstring bformat(docstring const & fmt, docstring arg1, int arg2);
313 template<> docstring bformat(docstring const & fmt, char const * arg1, docstring arg2);
314 template<> docstring bformat(docstring const & fmt, int arg1, int arg2);
315 template<> docstring bformat(docstring const & fmt, docstring arg1, docstring arg2, docstring arg3);
316 template<> docstring bformat(docstring const & fmt, docstring arg1, docstring arg2, docstring arg3, docstring arg4);
317
318
319 } // namespace support
320 } // namespace lyx
321
322 #endif