reorganized format_dt
[p2pool.git] / p2pool / util / math.py
1 from __future__ import absolute_import, division
2
3 import __builtin__
4 import math
5 import random
6 import time
7
8 def median(x, use_float=True):
9     # there exist better algorithms...
10     y = sorted(x)
11     if not y:
12         raise ValueError('empty sequence!')
13     left = (len(y) - 1)//2
14     right = len(y)//2
15     sum = y[left] + y[right]
16     if use_float:
17         return sum/2
18     else:
19         return sum//2
20
21 def mean(x):
22     total = 0
23     count = 0
24     for y in x:
25         total += y
26         count += 1
27     return total/count
28
29 def shuffled(x):
30     x = list(x)
31     random.shuffle(x)
32     return x
33
34 def shift_left(n, m):
35     # python: :(
36     if m >= 0:
37         return n << m
38     return n >> -m
39
40 def clip(x, (low, high)):
41     if x < low:
42         return low
43     elif x > high:
44         return high
45     else:
46         return x
47
48 add_to_range = lambda x, (low, high): (min(low, x), max(high, x))
49
50 def nth(i, n=0):
51     i = iter(i)
52     for _ in xrange(n):
53         i.next()
54     return i.next()
55
56 def geometric(p):
57     if p <= 0 or p > 1:
58         raise ValueError('p must be in the interval (0.0, 1.0]')
59     if p == 1:
60         return 1
61     return int(math.log1p(-random.random()) / math.log1p(-p)) + 1
62
63 def add_dicts_ext(add_func=lambda a, b: a+b, zero=0):
64     def add_dicts(*dicts):
65         res = {}
66         for d in dicts:
67             for k, v in d.iteritems():
68                 res[k] = add_func(res.get(k, zero), v)
69         return dict((k, v) for k, v in res.iteritems() if v != zero)
70     return add_dicts
71 add_dicts = add_dicts_ext()
72
73 mult_dict = lambda c, x: dict((k, c*v) for k, v in x.iteritems())
74
75 def format(x):
76     prefixes = 'kMGTPEZY'
77     count = 0
78     while x >= 100000 and count < len(prefixes) - 2:
79         x = x//1000
80         count += 1
81     s = '' if count == 0 else prefixes[count - 1]
82     return '%i' % (x,) + s
83
84 def format_dt(dt):
85     for value, name in [
86         (365.2425*60*60*24, 'years'),
87         (60*60*24, 'days'),
88         (60*60, 'hours'),
89         (60, 'minutes'),
90         (1, 'seconds'),
91     ]:
92         if dt > value:
93             break
94     return '%.01f %s' % (dt/value, name)
95
96 perfect_round = lambda x: int(x + random.random())
97
98 def erf(x):
99     # save the sign of x
100     sign = 1
101     if x < 0:
102         sign = -1
103     x = abs(x)
104     
105     # constants
106     a1 =  0.254829592
107     a2 = -0.284496736
108     a3 =  1.421413741
109     a4 = -1.453152027
110     a5 =  1.061405429
111     p  =  0.3275911
112     
113     # A&S formula 7.1.26
114     t = 1.0/(1.0 + p*x)
115     y = 1.0 - (((((a5*t + a4)*t) + a3)*t + a2)*t + a1)*t*math.exp(-x*x)
116     return sign*y # erf(-x) = -erf(x)
117
118 def find_root(y_over_dy, start, steps=10, bounds=(None, None)):
119     guess = start
120     for i in xrange(steps):
121         prev, guess = guess, guess - y_over_dy(guess)
122         if bounds[0] is not None and guess < bounds[0]: guess = bounds[0]
123         if bounds[1] is not None and guess > bounds[1]: guess = bounds[1]
124         if guess == prev:
125             break
126     return guess
127
128 def ierf(z):
129     return find_root(lambda x: (erf(x) - z)/(2*math.e**(-x**2)/math.sqrt(math.pi)), 0)
130
131 def binomial_conf_interval(x, n, conf=0.95):
132     assert 0 <= x <= n and 0 <= conf < 1
133     if n == 0:
134         left = random.random()*(1 - conf)
135         return left, left + conf
136     # approximate - Wilson score interval
137     z = math.sqrt(2)*ierf(conf)
138     p = x/n
139     topa = p + z**2/2/n
140     topb = z * math.sqrt(p*(1-p)/n + z**2/4/n**2)
141     bottom = 1 + z**2/n
142     return [clip(x, (0, 1)) for x in add_to_range(x/n, [(topa - topb)/bottom, (topa + topb)/bottom])]
143
144 minmax = lambda x: (min(x), max(x))
145
146 def format_binomial_conf(x, n, conf=0.95, f=lambda x: x):
147     if n == 0:
148         return '???'
149     left, right = minmax(map(f, binomial_conf_interval(x, n, conf)))
150     return '~%.1f%% (%.f-%.f%%)' % (100*f(x/n), math.floor(100*left), math.ceil(100*right))
151
152 def reversed(x):
153     try:
154         return __builtin__.reversed(x)
155     except TypeError:
156         return reversed(list(x))
157
158 class Object(object):
159     def __init__(self, **kwargs):
160         for k, v in kwargs.iteritems():
161             setattr(self, k, v)
162
163 def add_tuples(res, *tuples):
164     for t in tuples:
165         if len(t) != len(res):
166             raise ValueError('tuples must all be the same length')
167         res = tuple(a + b for a, b in zip(res, t))
168     return res
169
170 def flatten_linked_list(x):
171     while x is not None:
172         x, cur = x
173         yield cur
174
175 def weighted_choice(choices):
176     choices = list((item, weight) for item, weight in choices)
177     target = random.randrange(sum(weight for item, weight in choices))
178     for item, weight in choices:
179         if weight > target:
180             return item
181         target -= weight
182     raise AssertionError()
183
184 def natural_to_string(n, alphabet=None):
185     if n < 0:
186         raise TypeError('n must be a natural')
187     if alphabet is None:
188         s = ('%x' % (n,)).lstrip('0')
189         if len(s) % 2:
190             s = '0' + s
191         return s.decode('hex')
192     else:
193         assert len(set(alphabet)) == len(alphabet)
194         res = []
195         while n:
196             n, x = divmod(n, len(alphabet))
197             res.append(alphabet[x])
198         res.reverse()
199         return ''.join(res)
200
201 def string_to_natural(s, alphabet=None):
202     if alphabet is None:
203         assert not s.startswith('\x00')
204         return int(s.encode('hex'), 16) if s else 0
205     else:
206         assert len(set(alphabet)) == len(alphabet)
207         assert not s.startswith(alphabet[0])
208         return sum(alphabet.index(char) * len(alphabet)**i for i, char in enumerate(reversed(s)))
209
210 class RateMonitor(object):
211     def __init__(self, max_lookback_time):
212         self.max_lookback_time = max_lookback_time
213         
214         self.datums = []
215         self.first_timestamp = None
216     
217     def _prune(self):
218         start_time = time.time() - self.max_lookback_time
219         for i, (ts, datum) in enumerate(self.datums):
220             if ts > start_time:
221                 self.datums[:] = self.datums[i:]
222                 return
223     
224     def get_datums_in_last(self, dt=None):
225         if dt is None:
226             dt = self.max_lookback_time
227         assert dt <= self.max_lookback_time
228         self._prune()
229         now = time.time()
230         return [datum for ts, datum in self.datums if ts > now - dt], min(dt, now - self.first_timestamp) if self.first_timestamp is not None else 0
231     
232     def add_datum(self, datum):
233         self._prune()
234         t = time.time()
235         if self.first_timestamp is None:
236             self.first_timestamp = t
237         else:
238             self.datums.append((t, datum))
239
240 def merge_dicts(*dicts):
241     res = {}
242     for d in dicts: res.update(d)
243     return res