added RateMonitor class to clean up rate queue handling in main.py
[p2pool.git] / p2pool / util / math.py
1 from __future__ import absolute_import, division
2
3 import __builtin__
4 import math
5 import random
6 import time
7
8 def median(x, use_float=True):
9     # there exist better algorithms...
10     y = sorted(x)
11     if not y:
12         raise ValueError('empty sequence!')
13     left = (len(y) - 1)//2
14     right = len(y)//2
15     sum = y[left] + y[right]
16     if use_float:
17         return sum/2
18     else:
19         return sum//2
20
21 def mean(x):
22     total = 0
23     count = 0
24     for y in x:
25         total += y
26         count += 1
27     return total/count
28
29 def shuffled(x):
30     x = list(x)
31     random.shuffle(x)
32     return x
33
34 def shift_left(n, m):
35     # python: :(
36     if m >= 0:
37         return n << m
38     return n >> -m
39
40 def clip(x, (low, high)):
41     if x < low:
42         return low
43     elif x > high:
44         return high
45     else:
46         return x
47
48 def nth(i, n=0):
49     i = iter(i)
50     for _ in xrange(n):
51         i.next()
52     return i.next()
53
54 def geometric(p):
55     if p <= 0 or p > 1:
56         raise ValueError('p must be in the interval (0.0, 1.0]')
57     if p == 1:
58         return 1
59     return int(math.log1p(-random.random()) / math.log1p(-p)) + 1
60
61 def add_dicts(*dicts):
62     res = {}
63     for d in dicts:
64         for k, v in d.iteritems():
65             res[k] = res.get(k, 0) + v
66     return dict((k, v) for k, v in res.iteritems() if v)
67
68 def format(x):
69     prefixes = 'kMGTPEZY'
70     count = 0
71     while x >= 100000 and count < len(prefixes) - 2:
72         x = x//1000
73         count += 1
74     s = '' if count == 0 else prefixes[count - 1]
75     return '%i' % (x,) + s
76
77 def format_dt(dt):
78     for value, name in [(60*60*24, 'days'), (60*60, 'hours'), (60, 'minutes'), (1, 'seconds')]:
79         if dt > value:
80             break
81     return '%.01f %s' % (dt/value, name)
82
83 perfect_round = lambda x: int(x + random.random())
84
85 def erf(x):
86     # save the sign of x
87     sign = 1
88     if x < 0:
89         sign = -1
90     x = abs(x)
91     
92     # constants
93     a1 =  0.254829592
94     a2 = -0.284496736
95     a3 =  1.421413741
96     a4 = -1.453152027
97     a5 =  1.061405429
98     p  =  0.3275911
99     
100     # A&S formula 7.1.26
101     t = 1.0/(1.0 + p*x)
102     y = 1.0 - (((((a5*t + a4)*t) + a3)*t + a2)*t + a1)*t*math.exp(-x*x)
103     return sign*y # erf(-x) = -erf(x)
104
105 def find_root(y_over_dy, start, steps=10, bounds=(None, None)):
106     guess = start
107     for i in xrange(steps):
108         prev, guess = guess, guess - y_over_dy(guess)
109         if bounds[0] is not None and guess < bounds[0]: guess = bounds[0]
110         if bounds[1] is not None and guess > bounds[1]: guess = bounds[1]
111         if guess == prev:
112             break
113     return guess
114
115 def ierf(z):
116     return find_root(lambda x: (erf(x) - z)/(2*math.e**(-x**2)/math.sqrt(math.pi)), 0)
117
118 try:
119     from scipy import special
120 except ImportError:
121     print 'Install SciPy for more accurate confidence intervals!'
122     def binomial_conf_interval(x, n, conf=0.95):
123         assert 0 <= x <= n and 0 <= conf < 1
124         if n == 0:
125             left = random.random()*(1 - conf)
126         # approximate - Wilson score interval
127         z = math.sqrt(2)*ierf(conf)
128         p = x/n
129         topa = p + z**2/2/n
130         topb = z * math.sqrt(p*(1-p)/n + z**2/4/n**2)
131         bottom = 1 + z**2/n
132         return (topa - topb)/bottom, (topa + topb)/bottom
133 else:
134     def binomial_conf_interval(x, n, conf=0.95):
135         assert 0 <= x <= n and 0 <= conf < 1
136         if n == 0:
137             left = random.random()*(1 - conf)
138             return left, left + conf
139         bl = float(special.betaln(x+1, n-x+1))
140         def f(left_a):
141             left, right = max(1e-8, float(special.betaincinv(x+1, n-x+1, left_a))), min(1-1e-8, float(special.betaincinv(x+1, n-x+1, left_a + conf)))
142             top = math.exp(math.log(right)*(x+1) + math.log(1-right)*(n-x+1) + math.log(left) + math.log(1-left) - bl) - math.exp(math.log(left)*(x+1) + math.log(1-left)*(n-x+1) + math.log(right) + math.log(1-right) - bl)
143             bottom = (x - n*right)*left*(1-left) - (x - n*left)*right*(1-right)
144             return top/bottom
145         left_a = find_root(f, (1-conf)/2, bounds=(0, 1-conf))
146         return float(special.betaincinv(x+1, n-x+1, left_a)), float(special.betaincinv(x+1, n-x+1, left_a + conf))
147
148 def binomial_conf_center_radius(x, n, conf=0.95):
149     assert 0 <= x <= n and 0 <= conf < 1
150     left, right = binomial_conf_interval(x, n, conf)
151     if n == 0:
152         return (left+right)/2, (right-left)/2
153     p = x/n
154     return p, max(p - left, right - p)
155
156 minmax = lambda x: (min(x), max(x))
157
158 def format_binomial_conf(x, n, conf=0.95, f=lambda x: x):
159     if n == 0:
160         return '???'
161     left, right = minmax(map(f, binomial_conf_interval(x, n, conf)))
162     return '~%.1f%% (%.f-%.f%%)' % (100*f(x/n), math.floor(100*left), math.ceil(100*right))
163
164 def reversed(x):
165     try:
166         return __builtin__.reversed(x)
167     except TypeError:
168         return reversed(list(x))
169
170 class Object(object):
171     def __init__(self, **kwargs):
172         for k, v in kwargs.iteritems():
173             setattr(self, k, v)
174
175 def add_tuples(res, *tuples):
176     for t in tuples:
177         if len(t) != len(res):
178             raise ValueError('tuples must all be the same length')
179         res = tuple(a + b for a, b in zip(res, t))
180     return res
181
182 def flatten_linked_list(x):
183     while x is not None:
184         x, cur = x
185         yield cur
186
187 def weighted_choice(choices):
188     choices = list((item, weight) for item, weight in choices)
189     target = random.randrange(sum(weight for item, weight in choices))
190     for item, weight in choices:
191         if weight > target:
192             return item
193         target -= weight
194     raise AssertionError()
195
196 def natural_to_string(n, alphabet=None):
197     if n < 0:
198         raise TypeError('n must be a natural')
199     if alphabet is None:
200         s = '%x' % (n,)
201         if len(s) % 2:
202             s = '0' + s
203         return s.decode('hex')
204     else:
205         assert len(set(alphabet)) == len(alphabet)
206         res = []
207         while n:
208             n, x = divmod(n, len(alphabet))
209             res.append(alphabet[x])
210         res.reverse()
211         return ''.join(res)
212
213 def string_to_natural(s, alphabet=None):
214     if alphabet is None:
215         assert not s.startswith('\x00')
216         return int(s.encode('hex'), 16) if s else 0
217     else:
218         assert len(set(alphabet)) == len(alphabet)
219         assert not s.startswith(alphabet[0])
220         return sum(alphabet.index(char) * len(alphabet)**i for i, char in enumerate(reversed(s)))
221
222 class RateMonitor(object):
223     def __init__(self, max_lookback_time):
224         self.max_lookback_time = max_lookback_time
225         
226         self.datums = []
227         self.first_timestamp = None
228     
229     def _prune(self):
230         start_time = time.time() - self.max_lookback_time
231         for i, (ts, datum) in enumerate(self.datums):
232             if ts > start_time:
233                 self.datums[:] = self.datums[i:]
234                 return
235     
236     def get_datums_in_last(self, dt=None):
237         if dt is None:
238             dt = self.max_lookback_time
239         assert dt <= self.max_lookback_time
240         self._prune()
241         now = time.time()
242         return [datum for ts, datum in self.datums if ts > now - dt], min(dt, now - self.first_timestamp) if self.first_timestamp is not None else 0
243     
244     def add_datum(self, datum):
245         self._prune()
246         t = time.time()
247         self.datums.append((t, datum))
248         if self.first_timestamp is None:
249             self.first_timestamp = t
250
251 if __name__ == '__main__':
252     import random
253     a = 1
254     while True:
255         print a, format(a) + 'H/s'
256         a = a * random.randrange(2, 5)