source: trunk/source/level-0/l0-bignum64.lisp @ 15601

Last change on this file since 15601 was 15570, checked in by gb, 6 years ago

Lose the (unused) local function MULTIPLY-UNSIGNED-BIGNUMS from
MULTIPLY-BIGNUMS.

Implement MULTIPLY-BIGNUM-AND-FIXNUM in terms of
%MULTIPLY-AND-ADD-FIXNUMS-LOOP; this seems to make the non-GC
time of (DOTIMES (I 1000) (FACT 1000)) about 3X faster.

  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
File size: 72.6 KB
Line 
1;;;-*- Mode: Lisp; Package: CCL -*-
2;;;
3;;;   Copyright (C) 2009 Clozure Associates
4;;;   Copyright (C) 1994-2001 Digitool, Inc
5;;;   This file is part of Clozure CL. 
6;;;
7;;;   Clozure CL is licensed under the terms of the Lisp Lesser GNU Public
8;;;   License , known as the LLGPL and distributed with Clozure CL as the
9;;;   file "LICENSE".  The LLGPL consists of a preamble and the LGPL,
10;;;   which is distributed with Clozure CL as the file "LGPL".  Where these
11;;;   conflict, the preamble takes precedence. 
12;;;
13;;;   Clozure CL is referenced in the preamble as the "LIBRARY."
14;;;
15;;;   The LLGPL is also available online at
16;;;   http://opensource.franz.com/preamble.html
17
18(in-package "CCL")
19
20#+64-bit-target
21(eval-when (:compile-toplevel :execute)
22  (require "ARCH")
23  (require "NUMBER-MACROS")
24  (require "NUMBER-CASE-MACRO")
25
26  (defsetf bignum-ref bignum-set)
27 
28  (defconstant digit-size 32)
29  (defconstant half-digit-size (/ digit-size 2))
30 
31  (defconstant maximum-bignum-length (1- (ash 1 56)))
32  (defconstant all-ones-digit #xffffffff)
33  (deftype bignum-index () `(integer 0 (,maximum-bignum-length)))
34  (deftype bignum-element-type () `(unsigned-byte ,digit-size))
35  (deftype bignum-half-element-type () `(unsigned-byte ,half-digit-size))
36  (deftype bignum-type () 'bignum)
37  (defmacro %normalize-bignum-macro (big)
38    `(%normalize-bignum-2 t ,big))
39
40  (defmacro %mostly-normalize-bignum-macro (big)
41    `(%normalize-bignum-2 nil ,big))
42  (defmacro %lognot (x)
43    `(logand #xffffffff (lognot (the fixnum ,x))))
44  (defmacro %logior (x y)
45    `(logior (the fixnum ,x) (the fixnum ,y)))
46  (defmacro %logxor (x y)
47    `(logand #xffffffff (logxor (the fixnum ,x) (the fixnum ,y))))
48 
49  ;;; BIGNUM-REPLACE -- Internal.
50  ;;;
51  (defmacro bignum-replace (dest src &key (start1 '0) end1 (start2 '0) end2
52                                 from-end)
53    (once-only ((n-dest dest)
54                (n-src src))
55               (if (and (eq start1 0)(eq start2 0)(null end1)(null end2)(null from-end))
56                 ;; this is all true for some uses today <<
57                 `(%copy-ivector-to-ivector ,n-src 0 ,n-dest 0 (%ilsl 2 (min (the fixnum (%bignum-length ,n-src))
58                                                                         (the fixnum (%bignum-length ,n-dest)))))
59                 (let* ((n-start1 (gensym))
60                        (n-end1 (gensym))
61                        (n-start2 (gensym))
62                        (n-end2 (gensym)))
63                   `(let ((,n-start1 ,start1)
64                          (,n-start2 ,start2)
65                          (,n-end1 ,(or end1 `(%bignum-length ,n-dest)))
66                          (,n-end2 ,(or end2 `(%bignum-length ,n-src))))
67                     ,(if (null from-end)           
68                          `(%copy-ivector-to-ivector
69                            ,n-src (%i* 4 ,n-start2) 
70                            ,n-dest (%i* 4 ,n-start1)
71                            (%i* 4 (min (%i- ,n-end2 ,n-start2) 
72                                    (%i- ,n-end1 ,n-start1))))
73                          `(let ((nwds (min (%i- ,n-end2 ,n-start2)
74                                            (%i- ,n-end1 ,n-start1))))
75                            (%copy-ivector-to-ivector
76                             ,n-src (%ilsl 2 (%i- ,n-end2 nwds))
77                             ,n-dest (%ilsl 2 (%i- ,n-end1 nwds))
78                             (%i* 4 nwds))))))))) 
79 
80
81  ;;;; Shifting.
82 
83  (defconstant all-ones-half-digit #xFFFF) 
84 
85
86;;; %ALLOCATE-BIGNUM must zero all elements.
87;;;
88  (defmacro %allocate-bignum (ndigits)
89    `(%alloc-misc ,ndigits target::subtag-bignum))
90
91  (declaim (inline  %bignum-length))
92
93;;; This macro is used by BIGNUM-ASHIFT-RIGHT,
94;;; BIGNUM-BUFFER-ASHIFT-RIGHT, and BIGNUM-LDB-BIGNUM-RES. They supply
95;;; a termination form that references locals established by this
96;;; form. Source is the source bignum. Start-digit is the first digit
97;;; in source from which we pull bits. Start-pos is the first bit we
98;;; want. Res-len-form is the form that computes the length of the
99;;; resulting bignum. Termination is a DO termination form with a test
100;;; and body. When result is supplied, it is the variable to which
101;;; this binds a newly allocated bignum.
102;;;
103;;; Given start-pos, 1-31 inclusively, of shift, we form the j'th resulting
104;;; digit from high bits of the i'th source digit and the start-pos number of
105;;; bits from the i+1'th source digit.
106  (defmacro shift-right-unaligned (source
107                                   start-digit
108                                   start-pos
109                                   res-len-form
110                                   termination
111                                   &optional result)
112    `(let* ((high-bits-in-first-digit (- digit-size ,start-pos))
113            (res-len ,res-len-form)
114            (res-len-1 (1- res-len))
115            ,@(if result `((,result (%allocate-bignum res-len)))))
116      (declare (type bignum-index res-len res-len-1))
117      (do ((i ,start-digit i+1)
118           (i+1 (1+ ,start-digit) (1+ i+1))
119           (j 0 (1+ j)))
120          ,termination
121        (declare (type bignum-index i i+1 j))
122        (setf (bignum-ref ,(if result result source) j)
123              (%logior (%digit-logical-shift-right (bignum-ref ,source i)
124                                                   ,start-pos)
125                       (%ashl (bignum-ref ,source i+1)
126                              high-bits-in-first-digit))))))
127
128
129  )
130
131
132#+64-bit-target
133(progn
134
135;;; Extract the length of the bignum.
136;;;
137(defun %bignum-length (bignum)
138  (uvsize bignum)) 
139
140
141
142;;; We can probably do better than UVREF here, but
143;;; a) it's not -that- bad
144;;; b) it does some bounds/sanity checking, which isn't a bad idea.
145
146(defmacro bignum-ref (b i)
147  `(%typed-miscref :bignum ,b ,i))
148
149(defmacro bignum-set (b i val)
150  `(%typed-miscset :bignum ,b ,i ,val))
151
152
153(defun bignum-plusp (b)
154  (not (logbitp (1- digit-size) (the bignum-element-type (bignum-ref b (1- (%bignum-length b)))))))
155
156;;; Return T if digit is positive, or NIL if negative.
157(defun %digit-0-or-plusp (digit)
158  (declare (type bignum-element-type digit))
159  (not (logbitp (1- digit-size) digit)))
160
161(defun %bignum-0-or-plusp (bignum len)
162  (declare (type bignum-type bignum)
163           (type bignum-index len))
164  (%digit-0-or-plusp (bignum-ref bignum (1- len))))
165
166(defun bignum-minusp (b)
167  (logbitp 31 (the fixnum (bignum-ref b (1- (%bignum-length b))))))
168
169(defun %sign-digit (b i)
170  (%ashr (bignum-ref b (1- i)) (1- digit-size)))
171
172;;; Return the sign of bignum (0 or -1) as a fixnum
173(defun %bignum-sign (b)
174  (if (logbitp 31 (the fixnum (bignum-ref b (1- (%bignum-length b)))))
175    -1
176    0))
177
178         
179(defun %add-with-carry (a-digit b-digit carry-in)
180  (declare (fixnum a-digit b-digit carry-in))
181  (setq a-digit (logand all-ones-digit a-digit)
182        b-digit (logand all-ones-digit b-digit))
183  (let* ((sum (+ carry-in (the fixnum (+ a-digit b-digit)))))
184    (declare (fixnum sum))
185    (values (logand all-ones-digit sum) (logand 1 (the fixnum (ash sum -32))))))
186
187(defun %subtract-with-borrow (a-digit b-digit borrow-in)
188  (declare (fixnum a-digit b-digit borrow-in))
189  (setq a-digit (logand all-ones-digit a-digit)
190        b-digit (logand all-ones-digit b-digit))
191  (let* ((diff (- (the fixnum (- a-digit b-digit))
192                  (the fixnum (- 1 borrow-in)))))
193    (declare (fixnum diff))
194    (values (logand all-ones-digit diff)
195            (- 1 (logand (the fixnum (ash diff -32)) 1)))))
196
197
198
199(defun %compare-digits (bignum-a bignum-b idx)
200  (let* ((a (bignum-ref bignum-a idx))
201         (b (bignum-ref bignum-b idx)))
202    (declare (fixnum a b))
203    (if (= a b)
204      0
205      (if (> a b)
206        1
207        -1))))
208
209
210;;;; Addition.
211(defun add-bignums (a b)
212  (let* ((len-a (%bignum-length a))
213         (len-b (%bignum-length b)))
214    (declare (bignum-index len-a len-b)
215             (optimize (speed 3) (safety 0)))
216    (when (> len-b len-a)
217      (rotatef a b)
218      (rotatef len-a len-b))
219    (let* ((len-res (1+ len-a))
220           (res (%allocate-bignum len-res))
221           (carry 0)
222           (sign-b (%bignum-sign b)))
223        (dotimes (i len-b)
224          (let* ((sum (+
225                       (the fixnum (+ (the bignum-element-type (bignum-ref a i))
226                                      (the bignum-element-type (bignum-ref b i))))
227                       carry)))
228            (declare (fixnum sum))
229            (setf (bignum-ref res i) sum)
230            (setq carry (logand 1 (the fixnum (ash sum -32))))))
231        (if (/= len-a len-b)
232          (finish-bignum-add  res carry a sign-b len-b len-a)
233          (setf (bignum-ref res len-a)
234                (+ (the fixnum carry)
235                   (the fixnum (+ (the bignum-element-type (%bignum-sign a))
236                                  sign-b)))))
237        (%normalize-bignum-macro res))))
238
239(defun add-bignum-and-fixnum (bignum fixnum)
240  (declare (bignum-type bignum)
241           (fixnum fixnum)
242           (optimize (speed 3) (safety 0)))
243  (let* ((len-bignum (%bignum-length bignum))
244         (len-res (1+ len-bignum))
245         (res (%allocate-bignum len-res))
246         (low (logand all-ones-digit fixnum))
247         (high (logand all-ones-digit (the fixnum (ash fixnum -32)))))
248    (declare (bignum-index len-bignum)
249             (bignum-type res)
250             (bignum-element-type low high))
251    (let* ((sum0 (+ (the bignum-element-type (bignum-ref bignum 0)) low))
252           (sum1 (+ (the fixnum (+ (the bignum-element-type (bignum-ref bignum 1))
253                                   high))
254                    (the fixnum (logand 1 (ash sum0 -32)))))
255           (carry (logand 1 (ash sum1 -32))))
256      (declare (fixnum sum0 sum1) (bignum-element-type carry))
257      (setf (bignum-ref res 0) sum0
258            (bignum-ref res 1) sum1)
259      (if (> len-bignum 2)
260        (finish-bignum-add  res carry bignum (ash fixnum (- (- target::nbits-in-word target::fixnumshift))) 2 len-bignum)
261        (setf (bignum-ref res 2)
262              (+ (the fixnum carry)
263                 (the fixnum (+ (the bignum-element-type (%bignum-sign bignum))
264                                (the fixnum (ash fixnum (- (- target::nbits-in-word target::fixnumshift)))))))))
265      (%normalize-bignum-macro res))))
266
267
268
269
270
271;;; B was shorter than A; keep adding B's sign digit to each remaining
272;;; digit of A, propagating the carry.
273(defun finish-bignum-add (result carry a sign-b start end)
274  (declare (type bignum-index start end)
275           (bignum-element-type sign-b carry)
276           (optimize (speed 3) (safety 0)))
277  (do* ((i start (1+ i))
278        (sign-b (logand all-ones-digit sign-b)))
279       ((= i end)
280        (setf (bignum-ref result end)
281              (the fixnum (+
282                           (the fixnum (+ (the fixnum
283                                            (logand all-ones-digit
284                                                    (the fixnum
285                                                      (%sign-digit a end))))
286                                          sign-b))
287                           carry))))
288    (declare (fixnum i) (bignum-element-type sign-b))
289    (let* ((sum (the fixnum (+ (the fixnum (+ (bignum-ref a i)
290                                              sign-b))
291                               carry))))
292      (declare (fixnum sum))
293      (setf (bignum-ref result i) sum)
294      (setq carry (logand 1 (the fixnum (ash sum -32)))))))
295
296
297
298
299;;;; Subtraction.
300(defun subtract-bignum (a b)
301  (let* ((len-a (%bignum-length a))
302         (len-b (%bignum-length b))
303         (len-res (1+ (max len-a len-b)))
304         (res (%allocate-bignum len-res)))
305    (declare (bignum-index len-a len-b len-res))
306    (bignum-subtract-loop a len-a b len-b res)
307    (%normalize-bignum-macro res)))
308
309(defun bignum-subtract-loop (a len-a b len-b res)
310  (declare (bignum-index len-a len-b )
311           (optimize (speed 3) (safety 0)))
312  (let* ((len-res (%bignum-length res)))
313    (declare (bignum-index len-res))
314    (let* ((borrow 1)
315           (sign-a (%bignum-sign a))
316           (sign-b (%bignum-sign b)))
317      (declare (bignum-element-type borrow sign-a sign-b))
318      (dotimes (i (the bignum-index len-res))
319        (multiple-value-bind (result-digit borrow-out)
320            (%subtract-with-borrow
321             (if (< i len-a)
322               (bignum-ref a i)
323               sign-a)
324             (if (< i len-b)
325               (bignum-ref b i)
326               sign-b)
327             borrow)
328          (setf (bignum-ref res i) result-digit
329                borrow borrow-out))))))
330
331
332;;;; Multiplication.
333
334#||
335;;; These parameters match GMP's.
336(defvar *sqr-basecase-threshold* 5)
337(defvar *sqr-karatsuba-threshold* 22)
338(defvar *mul-karatsuba-threshold* 10)
339
340;;; Squaring is often simpler than multiplication.  This should never
341;;; be called with (>= N *sqr-karatsuba-threshold*).
342(defun mpn-sqr-basecase (prodp up n)
343  (declare (fixnum prodp up n))
344  (declare (optimize (speed 3) (safety 0) (space 0)))
345  (umulppm up up prodp)
346  (when (> n 1)
347    (%stack-block ((tarr (* 4 (* 2 *sqr-karatsuba-threshold*))))
348      (let* ((tp (macptr->fixnum tarr)))
349        (mpn-mul-1 tp
350                   (the fixnum (1+ up))
351                   (the fixnum (1- n))
352                   up
353                   (the fixnum (+ tp (the fixnum (1- n)))))
354        (do* ((i 2 (1+ i)))
355             ((= i n))
356          (declare (fixnum i))
357          (mpn-addmul-1 (the fixnum (- (the fixnum (+ tp (the fixnum (+ i i))))
358                                       2))
359                        (the fixnum (+ up i))
360                        (the fixnum (- n i))
361                        (the fixnum (+ up (the fixnum (1- i))))
362                        (the fixnum (+ tp (the fixnum (+ n (the fixnum (- i 2))))))))
363        (do* ((i 1 (1+ i))
364              (ul (1+ up) (1+ ul)))
365             ((= i n))
366          (declare (fixnum i ul))
367          (umulppm ul ul (the fixnum (+ prodp (the fixnum (+ i i))))))
368        (let* ((2n-2 (- (the fixnum (+ n n)) 2))
369               (carry (mpn-lshift-1 tp tp 2n-2)))
370          (declare (fixnum 2n-2 carry))
371          (incf carry (the fixnum (mpn-add-n (the fixnum (1+ prodp))
372                                             (the fixnum (1+ prodp))
373                                             tp
374                                             2n-2)))
375          (add-fixnum-to-limb carry (the fixnum (+ prodp
376                                                   (the fixnum (1-
377                                                                (the fixnum
378                                                                  (+ n n))))))))))))
379
380;;; For large enough values of N, squaring via Karatsuba-style
381;;; divide&conquer is faster than in the base case.
382(defun mpn-kara-sqr-n (p a n ws)
383  (declare (fixnum p a n ws))
384  (declare (optimize (speed 3) (safety 0) (space 0)))
385  (%stack-block ((limbs 16))
386    (let* ((w (macptr->fixnum limbs))
387           (w0 (1+ w))
388           (w1 (1+ w0))
389           (xx (1+ w1))
390           (n2 (ash n -1))
391           (x 0)
392           (y 0)
393           (i 0))
394      (declare (fixnum w w0 w1 xx n2 x y i))
395      (cond ((logbitp 0 n)
396             ;; Odd length
397             (let* ((n3 (- n n2))
398                    (n1 0)
399                    (nm1 0))
400               (declare (fixnum n3 n1 nm1))
401               (copy-limb (the fixnum (+ a n2)) w)
402               (if (not (limb-zerop w))
403                 (add-fixnum-to-limb
404                  (the fixnum
405                    (- (the fixnum (mpn-sub-n p a (the fixnum (+ a n3)) n2))))
406                  w)
407                 (progn
408                   (setq i n2)
409                   (loop
410                     (decf i)
411                     (copy-limb (the fixnum (+ a i)) w0)
412                     (copy-limb (the fixnum (+ a (the fixnum (+ n3 i)))) w1)
413                     (if (or (not (zerop (the fixnum (compare-limbs w0 w1))))
414                             (= i 0))
415                       (return)))
416                   (if (< (the fixnum (compare-limbs w0 w1)) 0)
417                     (setq x (+ a n3)
418                           y a)
419                     (setq y (+ a n3)
420                           x a))
421                   (mpn-sub-n p x y n2)))
422               (copy-limb w (the fixnum (+ p n2)))
423               (setq n1 (1+ n))
424               (cond ((< n3 *sqr-basecase-threshold*)
425                      (mpn-mul-basecase ws p n3 p n3)
426                      (mpn-mul-basecase p a n3 a n3))
427                     ((< n3 *sqr-karatsuba-threshold*)
428                      (mpn-sqr-basecase ws p n3)
429                      (mpn-sqr-basecase p a n3))
430                     (t
431                      (mpn-kara-sqr-n ws p n3 (the fixnum (+ ws n1)))
432                      (mpn-kara-sqr-n p  a n3 (the fixnum (+ ws n1)))))
433               (cond ((< n2 *sqr-basecase-threshold*)
434                      (mpn-mul-basecase (the fixnum (+ p n1))
435                                        (the fixnum (+ a n3))
436                                        n2
437                                        (the fixnum (+ a n3))
438                                        n2))
439                     ((< n2 *sqr-karatsuba-threshold*)
440                      (mpn-sqr-basecase (the fixnum (+ p n1))
441                                        (the fixnum (+ a n3))
442                                        n2))
443                     (t
444                      (mpn-kara-sqr-n (the fixnum (+ p n1))
445                                      (the fixnum (+ a n3))
446                                      n2
447                                      (the fixnum (+ ws n1)))))
448               (mpn-sub-n ws p ws n1)
449               (setq nm1 (1- n))
450               (unless (zerop (the fixnum
451                                (mpn-add-n ws
452                                           (the fixnum (+ p n1))
453                                           ws
454                                           nm1)))
455                 (copy-limb (the fixnum (+ ws nm1)) xx)
456                 (add-fixnum-to-limb 1 xx)
457                 (copy-limb xx (the fixnum (+ ws nm1)))
458                 (if (limb-zerop xx)
459                   (add-fixnum-to-limb 1 (the fixnum (+ ws n)))))
460               (unless (zerop
461                        (the fixnum
462                          (mpn-add-n (the fixnum (+ p n3))
463                                     (the fixnum (+ p n3))
464                                     ws
465                                     n1)))
466                 (mpn-incr-u (the fixnum (+ p (the fixnum (+ n1 n3))))
467                             1))))
468            (t ; N is even
469             (setq i n2)
470             (loop
471               (decf i)
472               (copy-limb (the fixnum (+ a i)) w0)
473               (copy-limb (the fixnum (+ a (the fixnum (+ n2 i)))) w1)
474               (if (or (not (zerop (the fixnum (compare-limbs w0 w1))))
475                       (= i 0))
476                 (return)))
477             (if (< (the fixnum (compare-limbs w0 w1)) 0)
478               (setq x (+ a n2)
479                     y a)
480               (setq y (+ a n2)
481                     x a))
482             (mpn-sub-n p x y n2)
483             (cond ((< n2 *sqr-basecase-threshold*)
484                    (mpn-mul-basecase ws p n2 p n2)
485                    (mpn-mul-basecase p a n2 a n2)
486                    (mpn-mul-basecase (the fixnum (+ p n))
487                                      (the fixnum (+ a n2))
488                                      n2
489                                      (the fixnum (+ a n2))
490                                      n2))
491                   ((< n2 *sqr-karatsuba-threshold*)
492                    (mpn-sqr-basecase ws p n2)
493                    (mpn-sqr-basecase p a n2)
494                    (mpn-sqr-basecase (the fixnum (+ p n))
495                                      (the fixnum (+ a n2))
496                                      n2))
497                   (t
498                    (mpn-kara-sqr-n ws p n2 (the fixnum (+ ws n)))
499                    (mpn-kara-sqr-n p  a n2 (the fixnum (+ ws n)))
500                    (mpn-kara-sqr-n (the fixnum (+ p n))
501                                    (the fixnum (+ a n2))
502                                    n2
503                                    (the fixnum (+ ws n)))))
504             (let* ((ww (- (the fixnum (mpn-sub-n ws p ws n)))))
505               (declare (fixnum ww))
506               (setq ww (+ ww (mpn-add-n ws (the fixnum (+ p n)) ws n)))
507               (setq ww (+ ww (mpn-add-n (the fixnum (+ p n2))
508                                         (the fixnum (+ p n2))
509                                         ws
510                                         n)))
511               (mpn-incr-u (the fixnum (+ p (the fixnum (+ n2 n)))) ww)))))))
512
513;;; Karatsuba subroutine: multiply A and B, store result at P, use WS
514;;; as scrach space.  Treats A and B as if they were both of size N;
515;;; if that's not true, caller must fuss around the edges.
516(defun mpn-kara-mul-n (p a b n ws)
517  (declare (fixnum p a b n ws))
518  (declare (optimize (speed 3) (safety 0) (space 0)))
519  (%stack-block ((limbs 16))
520    (let* ((w (macptr->fixnum limbs))
521           (w0 (1+ w))
522           (w1 (1+ w0))
523           (xx (1+ w1))
524           (x 0)
525           (y 0)
526           (i 0)
527           (n2 (ash n -1))
528           (sign 0))
529      (declare (fixnum w w0 w1 xx x y i n2 sign))
530      (cond ((logbitp 0 n)
531             (let* ((n1 0)
532                    (n3 (- n n2))
533                    (nm1 0))
534               (declare (fixnum n1 n3 nm1))
535               (copy-limb (the fixnum (+ a n2)) w)
536               (if (not (limb-zerop w))
537                 (add-fixnum-to-limb
538                  (the fixnum (- (mpn-sub-n p a (the fixnum (+ a n3)) n2))) w)
539                 (progn
540                   (setq i n2)
541                   (loop
542                     (decf i)
543                     (copy-limb (the fixnum (+ a i)) w0)
544                     (copy-limb (the fixnum (+ a (the fixnum (+ n3 i)))) w1)
545                     (if (or (not (zerop (the fixnum (compare-limbs w0 w1))))
546                             (zerop i))
547                       (return)))
548                   (if (< (the fixnum (compare-limbs w0 w1)) 0)
549                     (setq x (+ a n3)
550                           y a
551                           sign -1)
552                     (setq x a
553                           y (+ a n3)))
554                   (mpn-sub-n p x y n2)))
555               (copy-limb w (the fixnum (+ p n2)))
556               (copy-limb (the fixnum (+ b n2)) w)
557               (if (not (limb-zerop w))
558                 (add-fixnum-to-limb
559                  (the fixnum (- (the fixnum (mpn-sub-n (the fixnum (+ p n3))
560                                                        b
561                                                        (the fixnum (+ b n3))
562                                                        n2))))
563                  w)
564                 (progn
565                   (setq i n2)
566                   (loop
567                     (decf i)
568                     (copy-limb (the fixnum (+ b i)) w0)
569                     (copy-limb (the fixnum (+ b (the fixnum (+ n3 i)))) w1)
570                     (if (or (not (zerop (the fixnum (compare-limbs w0 w1))))
571                             (zerop i))
572                       (return)))
573                   (if (< (the fixnum (compare-limbs w0 w1)) 0)
574                     (setq x (+ b n3)
575                           y b
576                           sign (lognot sign))
577                     (setq x b
578                           y (+ b n3)))
579                   (mpn-sub-n (the fixnum (+ p n3)) x y n2)))
580               (copy-limb w (the fixnum (+ p n)))
581               (setq n1 (1+ n))
582               (cond
583                 ((< n2 *mul-karatsuba-threshold*)
584                  (cond
585                    ((< n3 *mul-karatsuba-threshold*)
586                     (mpn-mul-basecase ws p n3 (the fixnum (+ p n3)) n3)
587                     (mpn-mul-basecase p a n3 b n3))
588                    (t
589                     (mpn-kara-mul-n ws p (the fixnum (+ p n3)) n3 (the fixnum (+ ws n1)))
590                     (mpn-kara-mul-n p a b n3 (the fixnum (+ ws n1)))))
591                  (mpn-mul-basecase (the fixnum (+ p n1))
592                                    (the fixnum (+ a n3))
593                                    n2
594                                    (the fixnum (+ b n3))
595                                    n2))
596                 (t
597                  (mpn-kara-mul-n ws p (the fixnum (+ p n3)) n3 (the fixnum (+ ws n1)))
598                  (mpn-kara-mul-n p a b n3 (the fixnum (+ ws n1)))
599                  (mpn-kara-mul-n (the fixnum (+ p n1))
600                                  (the fixnum (+ a n3))
601                                  (the fixnum (+ b n3))
602                                  n2
603                                  (the fixnum (+ ws n1)))))
604               (if (not (zerop sign))
605                 (mpn-add-n ws p ws n1)
606                 (mpn-sub-n ws p ws n1))
607               (setq nm1 (1- n))
608               (unless (zerop (the fixnum (mpn-add-n ws
609                                                     (the fixnum (+ p n1))
610                                                     ws
611                                                     nm1)))
612                 (copy-limb (the fixnum (+ ws nm1)) xx)
613                 (add-fixnum-to-limb 1 xx)
614                 (copy-limb xx (the fixnum (+ ws nm1)))
615                 (if (limb-zerop xx)
616                   (add-fixnum-to-limb 1 (the fixnum (+ ws n)))))
617               (unless (zerop (the fixnum
618                                (mpn-add-n (the fixnum (+ p n3))
619                                           (the fixnum (+ p n3))
620                                           ws
621                                           n1)))
622                 (mpn-incr-u (the fixnum
623                               (+ p (the fixnum (+ n1 n3)))) 1))))
624            (t                          ; even length
625             (setq i n2)
626             (loop
627               (decf i)
628               (copy-limb (the fixnum (+ a i)) w0)
629               (copy-limb (the fixnum (+ a (the fixnum (+ n2 i)))) w1)
630               (if (or (not (zerop (the fixnum (compare-limbs w0 w1))))
631                       (zerop i))
632                 (return)))
633             (setq sign 0)
634             (if (< (the fixnum (compare-limbs w0 w1)) 0)
635               (setq x (+ a n2)
636                     y a
637                     sign -1)
638               (setq x a
639                     y (+ a n2)))
640             (mpn-sub-n p x y n2)
641             (setq i n2)
642             (loop
643               (decf i)
644               (copy-limb (the fixnum (+ b i)) w0)
645               (copy-limb (the fixnum (+ b (the fixnum (+ n2 i)))) w1)
646               (if (or (not (zerop (the fixnum (compare-limbs w0 w1))))
647                       (zerop i))
648                 (return)))           
649             (if (< (the fixnum (compare-limbs w0 w1)) 0)
650               (setq x (+ b n2)
651                     y b
652                     sign (lognot sign))
653               (setq x b
654                     y (+ b n2)))
655             (mpn-sub-n (the fixnum (+ p n2)) x y n2)
656             (cond
657               ((< n2 *mul-karatsuba-threshold*)
658                (mpn-mul-basecase ws p n2 (the fixnum (+ p n2)) n2)
659                (mpn-mul-basecase p a n2 b n2)
660                (mpn-mul-basecase (the fixnum (+ p n))
661                                  (the fixnum (+ a n2))
662                                  n2
663                                  (the fixnum (+ b n2))
664                                  n2))
665               (t
666                (mpn-kara-mul-n ws p (the fixnum (+ p n2)) n2
667                                (the fixnum (+ ws n)))
668                (mpn-kara-mul-n p a b n2 (the fixnum (+ ws n)))
669                (mpn-kara-mul-n (the fixnum (+ p n))
670                                (the fixnum (+ a n2))
671                                (the fixnum (+ b n2))
672                                n2
673                                (the fixnum (+ ws n)))))
674             (let* ((ww (if (not (zerop sign))
675                          (mpn-add-n ws p ws n)
676                          (- (the fixnum (mpn-sub-n ws p ws n))))))
677               (declare (fixnum ww))
678               (setq ww (+ ww (mpn-add-n ws (the fixnum (+ p n)) ws n)))
679               (setq ww (+ ww (mpn-add-n (the fixnum (+ p n2))
680                                         (the fixnum (+ p n2))
681                                         ws
682                                         n)))
683               (mpn-incr-u (the fixnum (+ p (the fixnum (+ n2 n)))) ww)))))))
684
685;;; Square UP, of length UN.  I wonder if a Karatsuba multiply might be
686;;; faster than a basecase square.
687(defun mpn-sqr-n (prodp up un)
688  (declare (fixnum prodp up un))
689  (declare (optimize (speed 3) (safety 0) (space 0)))
690  (if (< un *sqr-basecase-threshold*)
691    (mpn-mul-basecase prodp up un up un)
692    (if (< un *sqr-karatsuba-threshold*)
693      (mpn-sqr-basecase prodp up un)
694      (%stack-block ((wsptr (mpn-kara-sqr-n-tsize un)))
695        (mpn-kara-sqr-n prodp up un (macptr->fixnum wsptr))))))
696
697;;; Subroutine: store AxB at P.  Assumes A & B to be of length N
698(defun mpn-mul-n (p a b n)
699  (declare (fixnum p a b n))
700  (declare (optimize (speed 3) (safety 0) (space 0))) 
701  (if (< n *mul-karatsuba-threshold*)
702    (mpn-mul-basecase p a n b n)
703    (%stack-block ((wsptr (mpn-kara-mul-n-tsize n)))
704      (mpn-kara-mul-n p a b n (macptr->fixnum wsptr)))))
705
706
707;;; Multiply [UP,UN] by [VP,VN].  UN must not be less than VN.
708;;; This does Karatsuba if operands are big enough; if they are
709;;; and they differ in size, this computes the product of the
710;;; smaller-size slices, then fixes up the resut.
711(defun mpn-mul (prodp up un vp vn)
712  (declare (fixnum prodp up un vp vn))
713  (declare (optimize (speed 3) (safety 0) (space 0)))
714  ;(assert (>= un vn 1))
715  (if (and (= up vp) (= un vn))
716    (mpn-sqr-n prodp up un)
717    (if (< vn *mul-karatsuba-threshold*)
718      (mpn-mul-basecase prodp up un vp vn)
719      (let* ((l vn))
720        (declare (fixnum l))
721        (mpn-mul-n prodp up vp vn)
722        (unless (= un vn)
723          (incf prodp vn)
724          (incf up vn)
725          (decf un vn)
726          (if (< un vn)
727            (psetq un vn vn un up vp vp up))
728          (%stack-block ((wsptr
729                          (the fixnum
730                            (+ 8
731                               (the fixnum
732                                 (* 4
733                                    (the fixnum
734                                      (+ vn
735                                         (if (>= vn *mul-karatsuba-threshold*)
736                                           vn
737                                           un)))))))))
738            (setf (%get-unsigned-long wsptr 0) 0
739                  (%get-unsigned-long wsptr 4) 0)
740            (let* ((tt (macptr->fixnum wsptr))
741                   (c (1+ tt))
742                   (ws (1+ c)))
743              (declare (fixnum tt c ws ))
744              (do* ()
745                   ((< vn *mul-karatsuba-threshold*))
746                (mpn-mul-n ws up vp vn)
747                (cond ((<= l (the fixnum (+ vn vn)))
748                       (add-fixnum-to-limb (mpn-add-n prodp prodp ws l) tt)
749                       (unless (= l (the fixnum (+ vn vn)))
750                         (copy-fixnum-to-limb
751                          (mpn-add-1 (the fixnum (+ prodp l))
752                                     (the fixnum (+ ws l))
753                                     (the fixnum (- (the fixnum (+ vn vn)) l))
754                                     tt)
755                          tt)
756                         (setq l (the fixnum (+ vn vn)))))
757                      (t
758                       (copy-fixnum-to-limb
759                        (mpn-add-n prodp prodp ws (the fixnum (+ vn vn))) c)
760                       (add-fixnum-to-limb
761                        (mpn-add-1 (the fixnum (+ prodp (the fixnum (+ vn vn))))
762                                   (the fixnum (+ prodp (the fixnum (+ vn vn))))
763                                   (the fixnum (- l (the fixnum (+ vn vn))))
764                                   c)
765                        tt)))
766                (incf prodp vn)
767                (decf l vn)
768                (incf up vn)
769                (decf un vn)
770                (if (< un vn)
771                  (psetq up vp vp up un vn vn un)))
772              (unless (zerop vn)
773                (mpn-mul-basecase ws up un vp vn)
774                (cond ((<= l (the fixnum (+ un vn)))
775                       (add-fixnum-to-limb
776                        (mpn-add-n prodp prodp ws l)
777                        tt)
778                       (unless (= l (the fixnum (+ un vn)))
779                         (copy-fixnum-to-limb
780                          (mpn-add-1 (the fixnum (+ prodp l))
781                                     (the fixnum (+ ws l))
782                                     (the fixnum (- (the fixnum (+ un vn)) l))
783                                     tt)
784                          tt)))
785                      (t
786                       (copy-fixnum-to-limb
787                        (mpn-add-n prodp prodp ws (the fixnum (+ un vn)))
788                        c)
789                       (add-fixnum-to-limb
790                        (mpn-add-1
791                         (the fixnum (+ prodp (the fixnum (+ un vn))))
792                         (the fixnum (+ prodp (the fixnum (+ un vn))))
793                         (the fixnum (- (the fixnum (- l un)) vn))
794                         c)
795                        tt)))))))))))
796||#
797
798(defun multiply-bignums (a b)
799  (let* ((signs-differ (not (eq (bignum-minusp a) (bignum-minusp b)))))
800    (flet ((multiply-unsigned-bignums64 (a b)
801             (let* ((len-a (ceiling (%bignum-length a) 2))
802                    (len-b (ceiling (%bignum-length b) 2))
803                    (len-res (+ len-a len-b))
804                    (res (%allocate-bignum (+ len-res len-res))))
805               (declare (bignum-index len-a len-b len-res))
806               (dotimes (i len-a)
807                 (declare (type bignum-index i))
808                 (%multiply-and-add-loop64 a b res i len-b))
809               res)))
810      (let* ((res (with-negated-bignum-buffers a b
811                                               multiply-unsigned-bignums64)))
812        (if signs-differ (negate-bignum-in-place res))
813        (%normalize-bignum-macro res)))))
814
815#+old
816(defun multiply-bignum-and-fixnum (bignum fixnum)
817  (declare (type bignum-type bignum) (fixnum fixnum))
818  (if (eql fixnum 1)
819    bignum
820    (with-small-bignum-buffers ((big-fix fixnum))
821      (multiply-bignums bignum big-fix))))
822
823(defun multiply-bignum-and-fixnum (bignum fixnum)
824  (declare (type bignum-type bignum) (fixnum fixnum))
825  (if (eql fixnum 1)
826    bignum
827    (let* ((bignum-len (%bignum-length bignum))
828           (bignum-plus-p (bignum-plusp bignum))
829           (fixnum-plus-p (not (minusp fixnum)))
830           (negate-res (neq bignum-plus-p fixnum-plus-p)))
831      (declare (type bignum-type bignum)
832               (type bignum-index bignum-len))
833      (flet ((do-it (bignum fixnum  negate-res)
834               (let* ((bignum-len (%bignum-length bignum))
835                      (result (%allocate-bignum (the fixnum (+ bignum-len 2))))
836                      (len64 (ash (1+ bignum-len) -1)))
837                 (declare (type bignum-type bignum)
838                          (type bignum-index bignum-len len64))
839                 (%multiply-and-add-fixnum-loop len64 bignum fixnum result)
840                 (when negate-res
841                   (negate-bignum-in-place result))
842                 (%normalize-bignum-macro result ))))
843        (declare (dynamic-extent #'do-it))
844        (if bignum-plus-p
845          (do-it bignum (if fixnum-plus-p fixnum (- fixnum))  negate-res)
846          (with-bignum-buffers ((b1 (the fixnum (1+ bignum-len))))
847            (negate-bignum bignum nil b1)
848            (do-it b1 (if fixnum-plus-p fixnum (- fixnum))  negate-res)))))))
849
850
851;; assume we already know result won't fit in a fixnum
852;; only caller is fixnum-*-2
853;;
854
855(defun multiply-fixnums (a b)
856  (declare (fixnum a b))
857  (* a b))
858
859
860;;;; GCD.
861
862
863;;; Both args are > 0.
864(defun bignum-fixnum-gcd (bignum fixnum)
865  (let* ((rem (bignum-truncate-by-fixnum-no-quo bignum fixnum)))
866    (declare (fixnum rem))
867    (if (zerop rem)
868      fixnum
869      (%fixnum-gcd rem fixnum))))
870
871
872
873;;; NEGATE-BIGNUM -- Public.
874;;;
875;;; Fully-normalize is an internal optional.  It cause this to always return
876;;; a bignum, without any extraneous digits, and it never returns a fixnum.
877;;;
878(defun negate-bignum (x &optional (fully-normalize t) res)
879  (declare (type bignum-type x))
880  (let* ((len-x (%bignum-length x))
881         (len-res (1+ len-x))
882         (minusp (bignum-minusp x))
883         (res (or res (%allocate-bignum len-res))))
884    (declare (type bignum-index len-x len-res)) ;Test len-res for range?
885    (let ((carry (bignum-negate-loop-really x len-x res)))
886      (declare (fixnum carry))
887      (if (zerop carry)
888        (setf (bignum-ref res len-x) (if minusp 0 all-ones-digit))
889        (setf (bignum-ref res len-x) (if minusp 1 0))))
890    (if fully-normalize
891      (%normalize-bignum-macro res)
892      (%mostly-normalize-bignum-macro res))))
893
894;;; NEGATE-BIGNUM-IN-PLACE -- Internal.
895;;;
896;;; This assumes bignum is positive; that is, the result of negating it will
897;;; stay in the provided allocated bignum.
898;;;
899(defun negate-bignum-in-place (bignum)
900  (bignum-negate-loop-really bignum (%bignum-length bignum) bignum)
901  bignum)
902
903
904 
905
906(defun copy-bignum (bignum)
907  (let ((res (%allocate-bignum (%bignum-length bignum))))
908    (bignum-replace res bignum)
909    res))
910
911
912
913;;; BIGNUM-ASHIFT-RIGHT -- Public.
914;;;
915;;; First compute the number of whole digits to shift, shifting them by
916;;; skipping them when we start to pick up bits, and the number of bits to
917;;; shift the remaining digits into place.  If the number of digits is greater
918;;; than the length of the bignum, then the result is either 0 or -1.  If we
919;;; shift on a digit boundary (that is, n-bits is zero), then we just copy
920;;; digits.  The last branch handles the general case which uses a macro that a
921;;; couple other routines use.  The fifth argument to the macro references
922;;; locals established by the macro.
923;;;
924
925
926(defun bignum-ashift-right (bignum x)
927  (declare (type bignum-type bignum)
928           (fixnum x)
929           (optimize (speed 3) (safety 0)))
930  (let ((bignum-len (%bignum-length bignum)))
931    (declare (type bignum-index bignum-len))
932    (multiple-value-bind (digits n-bits) (truncate x digit-size)
933      (declare (type bignum-index digits)(fixnum n-bits))
934      (cond
935       ((>= digits bignum-len)
936        (if (bignum-plusp bignum) 0 -1))
937       ((eql 0 n-bits)
938        (bignum-ashift-right-digits bignum digits))
939       (t
940        (shift-right-unaligned bignum digits n-bits (- bignum-len digits)
941                                      ((= j res-len-1)
942                                       (setf (bignum-ref res j)
943                                             (%ashr (bignum-ref bignum i) n-bits))
944                                       (%normalize-bignum-macro res))
945                                      res))))))
946
947                               
948
949
950
951;;; BIGNUM-ASHIFT-RIGHT-DIGITS -- Internal.
952;;;
953(defun bignum-ashift-right-digits (bignum digits)
954  (declare (type bignum-type bignum)
955           (type bignum-index digits))
956  (let* ((res-len (- (%bignum-length bignum) digits))
957         (res (%allocate-bignum res-len)))
958    (declare (type bignum-index res-len)
959             (type bignum-type res))
960    (bignum-replace res bignum :start2 digits)
961    (%normalize-bignum-macro res)))
962
963
964;;; BIGNUM-BUFFER-ASHIFT-RIGHT -- Internal.
965;;;
966;;; GCD uses this for an in-place shifting operation.  This is different enough
967;;; from BIGNUM-ASHIFT-RIGHT that it isn't worth folding the bodies into a
968;;; macro, but they share the basic algorithm.  This routine foregoes a first
969;;; test for digits being greater than or equal to bignum-len since that will
970;;; never happen for its uses in GCD.  We did fold the last branch into a macro
971;;; since it was duplicated a few times, and the fifth argument to it
972;;; references locals established by the macro.
973;;;
974 
975
976;;; BIGNUM-ASHIFT-LEFT -- Public.
977;;;
978;;; This handles shifting a bignum buffer to provide fresh bignum data for some
979;;; internal routines.  We know bignum is safe when called with bignum-len.
980;;; First we compute the number of whole digits to shift, shifting them
981;;; starting to store farther along the result bignum.  If we shift on a digit
982;;; boundary (that is, n-bits is zero), then we just copy digits.  The last
983;;; branch handles the general case.
984;;;
985(defun bignum-ashift-left (bignum x &optional bignum-len)
986  (declare (type bignum-type bignum)
987           (fixnum x)
988           (type (or null bignum-index) bignum-len))
989  (multiple-value-bind (digits n-bits)
990                       (truncate x digit-size)
991    (declare (fixnum digits n-bits))
992    (let* ((bignum-len (or bignum-len (%bignum-length bignum)))
993           (res-len (+ digits bignum-len 1)))
994      (declare (fixnum bignum-len res-len))
995      (when (> res-len maximum-bignum-length)
996        (error "Can't represent result of left shift."))
997      (if (zerop n-bits)
998        (bignum-ashift-left-digits bignum bignum-len digits)
999        (bignum-ashift-left-unaligned bignum digits n-bits res-len)))))
1000
1001;;; BIGNUM-ASHIFT-LEFT-DIGITS -- Internal.
1002;;;
1003(defun bignum-ashift-left-digits (bignum bignum-len digits)
1004  (declare (type bignum-index bignum-len digits))
1005  (let* ((res-len (+ bignum-len digits))
1006         (res (%allocate-bignum res-len)))
1007    (declare (type bignum-index res-len))
1008    (bignum-replace res bignum :start1 digits :end1 res-len :end2 bignum-len
1009                    :from-end t)
1010    res))
1011
1012
1013
1014;;; BIGNUM-ASHIFT-LEFT-UNALIGNED -- Internal.
1015;;;
1016;;; BIGNUM-TRUNCATE uses this to store into a bignum buffer by supplying res.
1017;;; When res comes in non-nil, then this foregoes allocating a result, and it
1018;;; normalizes the buffer instead of the would-be allocated result.
1019;;;
1020;;; We start storing into one digit higher than digits, storing a whole result
1021;;; digit from parts of two contiguous digits from bignum.  When the loop
1022;;; finishes, we store the remaining bits from bignum's first digit in the
1023;;; first non-zero result digit, digits.  We also grab some left over high
1024;;; bits from the last digit of bignum.
1025;;;
1026
1027(defun bignum-ashift-left-unaligned (bignum digits n-bits res-len
1028                                            &optional (res nil resp))
1029  (declare (type bignum-index digits res-len)
1030           (type (mod #.digit-size) n-bits))
1031  (let* ((remaining-bits (- digit-size n-bits))
1032         (res-len-1 (1- res-len))
1033         (res (or res (%allocate-bignum res-len))))
1034    (declare (type bignum-index res-len res-len-1)
1035             (optimize (speed 3) (safety 0)))
1036    (do ((i 0 i+1)
1037         (i+1 1 (1+ i+1))
1038         (j (1+ digits) (1+ j)))
1039        ((= j res-len-1)
1040         (setf (bignum-ref res digits)
1041               (%ashl (bignum-ref bignum 0) n-bits))
1042         (setf (bignum-ref res j)
1043               (%ashr (bignum-ref bignum i) remaining-bits))
1044         (if resp
1045           (%zero-trailing-sign-digits res res-len)
1046           (%mostly-normalize-bignum-macro res)))
1047      (declare (type bignum-index i i+1 j))
1048      (setf (bignum-ref res j)
1049            (%logior (%digit-logical-shift-right (bignum-ref bignum i)
1050                                                 remaining-bits)
1051                     (%ashl (bignum-ref bignum i+1) n-bits))))))
1052
1053
1054
1055
1056
1057
1058
1059;;;; Relational operators.
1060
1061
1062
1063;;; BIGNUM-COMPARE -- Public.
1064;;;
1065;;; This compares two bignums returning -1, 0, or 1, depending on whether a
1066;;; is less than, equal to, or greater than b.
1067;;;
1068;(proclaim '(function bignum-compare (bignum bignum) (integer -1 1)))
1069(defun bignum-compare (a b)
1070  (declare (type bignum-type a b))
1071  (let* ((a-plusp (bignum-plusp a))
1072         (b-plusp (bignum-plusp b)))
1073    (if (eq a-plusp b-plusp)
1074      (let* ((len-a (%bignum-length a))
1075             (len-b (%bignum-length b)))
1076        (declare (type bignum-index len-a len-b))
1077        (cond ((= len-a len-b)
1078               (do* ((i (1- len-a) (1- i)))
1079                    ((zerop i) (%compare-digits a b 0))
1080                 (declare (fixnum i))
1081                 (let* ((signum (%compare-digits a b i)))
1082                   (declare (fixnum signum))
1083                   (unless (zerop signum)
1084                     (return signum)))))
1085              ((> len-a len-b)
1086               (if a-plusp 1 -1))
1087              (t (if a-plusp -1 1))))
1088      (if a-plusp 1 -1))))
1089
1090
1091
1092
1093
1094
1095;;;; Integer length and logcount
1096
1097
1098(defun bignum-integer-length (big)
1099  (the fixnum (- (the fixnum (ash (the fixnum (%bignum-length big)) 5))
1100                 (the fixnum (%bignum-sign-bits big)))))
1101
1102; (not (zerop (logand integer1 integer2)
1103
1104(defun bignum-logtest (num1 num2)
1105  (let* ((length1 (%bignum-length num1))
1106         (length2 (%bignum-length num2))
1107         (n1-minusp (bignum-minusp num1))
1108         (n2-minusp (bignum-minusp num2)))
1109    (declare (fixnum length1 length2))
1110    (if (and n1-minusp n2-minusp) ; both neg, get out quick
1111      T       
1112      (or (dotimes (i (min length1 length2))
1113            (unless (zerop (the fixnum
1114                             (logand (the fixnum (bignum-ref num1 i))
1115                                     (the fixnum (bignum-ref num2 i)))))
1116              (return t)))
1117          (if (< length1 length2)
1118            n1-minusp
1119            (if (< length2 length1)
1120              n2-minusp))))))
1121
1122(defun logtest-fix-big (fix big)
1123  (declare (fixnum fix))
1124  (unless (zerop fix)
1125    (if (plusp fix)
1126      (or
1127       (not (eql 0 (the fixnum (logand (the fixnum (bignum-ref big 0)) fix))))
1128       (and (> (%bignum-length big) 1)
1129            (not (eql 0 (the fixnum (logand (the fixnum (bignum-ref big 1))
1130                                            (the fixnum (ash fix -32))))))))
1131      t)))
1132
1133
1134(defun bignum-logcount (bignum)
1135  (declare (type bignum-type bignum))
1136  (let* ((length (%bignum-length bignum))
1137         (plusp (bignum-plusp bignum))
1138         (result 0))
1139    (declare (type bignum-index length)
1140             (fixnum result))
1141    (if plusp
1142      (dotimes (index length result)
1143        (incf result (the fixnum (%logcount bignum index))))
1144      (dotimes (index length result)
1145        (incf result (the fixnum (%logcount-complement bignum index)))))))
1146
1147
1148;;;; Logical operations.
1149
1150;;; NOT.
1151;;;
1152
1153;;; BIGNUM-LOGICAL-NOT -- Public.
1154;;;
1155(defun bignum-logical-not (a)
1156  (declare (type bignum-type a))
1157  (let* ((len (%bignum-length a))
1158         (res (%allocate-bignum len)))
1159    (declare (type bignum-index len))
1160    (dotimes (i len res)
1161      (bignum-set res i (%lognot (the fixnum (bignum-ref a i)))))))
1162
1163
1164
1165
1166;;; AND.
1167;;;
1168
1169;;; BIGNUM-LOGICAL-AND -- Public.
1170;;;
1171(defun bignum-logical-and (a b)
1172  (declare (type bignum-type a b))
1173  (let* ((len-a (%bignum-length a))
1174         (len-b (%bignum-length b))
1175         (shorter a)
1176         (longer b)
1177         (shorter-len len-a)
1178         (longer-len len-b)
1179         (shorter-positive (bignum-plusp a)))
1180    (declare (type bignum-index len-a len-b shorter-len longer-len))
1181    (when (< len-b len-a)
1182      (setq shorter b
1183            longer a
1184            shorter-len len-b
1185            longer-len len-a
1186            shorter-positive (bignum-plusp b)))
1187    (let* ((result (%allocate-bignum longer-len)))
1188      (%bignum-logand shorter-len shorter longer result)
1189      (unless shorter-positive
1190        (bignum-replace result longer :start1 shorter-len :start2 shorter-len :end1 longer-len :end2 longer-len))
1191      (%normalize-bignum-macro result))))
1192
1193
1194;;;
1195;;;
1196;;; bignum-logandc2
1197
1198(defun bignum-logandc2 (a b)
1199  (declare (type bignum-type a b))
1200  (let* ((len-a (%bignum-length a))
1201         (len-b (%bignum-length b))
1202         (a-plusp (bignum-plusp a))
1203         (b-plusp (bignum-plusp b)))
1204    (declare (type bignum-index len-a len-b))
1205    (cond
1206     ((< len-a len-b)
1207      (logandc2-shorter-any a len-a b len-b (if a-plusp (%allocate-bignum len-a) (%allocate-bignum len-b))))
1208     ((< len-b len-a) ; b shorter
1209      (logandc1-shorter-any b len-b a len-a (if b-plusp (%allocate-bignum len-a)(%allocate-bignum len-b))))
1210     (t (logandc2-shorter-any a len-a b len-b (%allocate-bignum len-a))))))
1211
1212(defun logandc2-shorter-any (a len-a b len-b res)
1213  (declare (type bignum-type a b res)
1214           (type bignum-index len-a len-b))
1215  (dotimes (i len-a)
1216    (setf (bignum-ref res i)
1217          (logand (the fixnum (bignum-ref a i))
1218                  (the fixnum (%lognot (the fixnum (bignum-ref b i)))))))
1219  (if (bignum-minusp a)
1220    (do ((i len-a (1+ i)))
1221          ((= i len-b))
1222        (declare (type bignum-index i))
1223      (setf (bignum-ref res i)
1224            (%lognot (the fixnum (bignum-ref b i))))))
1225  (%normalize-bignum-macro res))
1226
1227
1228
1229(defun logandc1-shorter-any (a len-a b len-b res)
1230  (declare (type bignum-type a b res)
1231           (type bignum-index len-a len-b))
1232  (dotimes (i len-a)
1233    (setf (bignum-ref res i)
1234          (logand
1235           (the fixnum (%lognot (the fixnum (bignum-ref a i))))
1236           (the fixnum (bignum-ref b i)))))
1237  (when (bignum-plusp a)
1238    (unless (= len-a len-b)
1239      (bignum-replace res b :start1 len-a :start2 len-a :end1 len-b :end2 len-b)))
1240  (%normalize-bignum-macro res))
1241
1242
1243
1244(defun fix-big-logand (fix big)
1245  (let* ((len-b (%bignum-length big))
1246         (res (if (< fix 0)(%allocate-bignum len-b))))
1247    (declare (fixnum fix len-b))       
1248    (let ((val (fix-digit-logand fix big res)))
1249      (if res
1250        (progn
1251          (bignum-replace res big :start1 2 :start2 2 :end1 len-b :end2 len-b)
1252          (%normalize-bignum-macro res))
1253        val))))
1254
1255
1256(defun fix-big-logandc2 (fix big)
1257  (let* ((len-b (%bignum-length big))
1258         (res (if (< fix 0)(%allocate-bignum len-b))))
1259    (declare (fixnum fix len-b))       
1260    (let ((val (fix-digit-logandc2 fix big res)))
1261      (if res
1262        (progn
1263          (do ((i 2 (1+ i)))
1264              ((= i len-b))
1265            (declare (type bignum-index i))
1266            (setf (bignum-ref res i)
1267                  (%lognot (bignum-ref big i))))
1268          (%normalize-bignum-macro res))
1269        val))))
1270
1271(defun fix-big-logandc1 (fix big)
1272  (let* ((len-b (%bignum-length big))
1273         (res (if (>= fix 0)(%allocate-bignum len-b))))
1274    (declare (fixnum fix len-b))       
1275    (let ((val (fix-digit-logandc1 fix big res)))
1276      (if res
1277        (progn 
1278          (bignum-replace res big :start1 2 :start2 2 :end1 len-b :end2 len-b)
1279          (%normalize-bignum-macro res))
1280        val))))
1281
1282
1283;;; IOR.
1284;;;
1285
1286;;; BIGNUM-LOGICAL-IOR -- Public.
1287;;;
1288(defun bignum-logical-ior (a b)
1289  (declare (type bignum-type a b))
1290  (let* ((len-a (%bignum-length a))
1291         (len-b (%bignum-length b))
1292         (longer-len len-b)
1293         (shorter-len len-a)
1294         (shorter a)
1295         (longer b)
1296         (shorter-positive (bignum-plusp a)))
1297    (declare (type bignum-index len-a len-b longer-len shorter-len))
1298    (when (< len-b len-a)
1299      (setq shorter b
1300            longer a
1301            shorter-len len-b
1302            longer-len len-a
1303            shorter-positive (bignum-plusp b)))
1304    (let* ((result (%allocate-bignum longer-len)))
1305      (%bignum-logior shorter-len shorter longer result)
1306      (unless (= shorter-len longer-len)
1307        (if shorter-positive
1308          (bignum-replace result longer :start1 shorter-len :start2 shorter-len :end1 longer-len :end2 longer-len)
1309          (do* ((i shorter-len (1+ i)))
1310               ((= i longer-len))
1311            (declare (type bignum-index i))
1312            (setf (bignum-ref result i) #xffffffff))))
1313      (%normalize-bignum-macro result))))
1314
1315
1316
1317;;; XOR.
1318;;;
1319
1320;;; BIGNUM-LOGICAL-XOR -- Public.
1321;;;
1322(defun bignum-logical-xor (a b)
1323  (declare (type bignum-type a b))
1324  (let ((len-a (%bignum-length a))
1325        (len-b (%bignum-length b)))
1326    (declare (type bignum-index len-a len-b))
1327    (if (< len-a len-b)
1328        (bignum-logical-xor-aux a len-a b len-b (%allocate-bignum len-b))
1329        (bignum-logical-xor-aux b len-b a len-a (%allocate-bignum len-a)))))
1330
1331;;; BIGNUM-LOGICAL-XOR-AUX -- Internal.
1332;;;
1333;;; This takes the the shorter of two bignums in a and len-a.  Res is len-b
1334;;; long.  Do the XOR.
1335;;;
1336(defun bignum-logical-xor-aux (a len-a b len-b res)
1337  (declare (type bignum-type a b res)
1338           (type bignum-index len-a len-b))
1339  (dotimes (i len-a)
1340    (setf (bignum-ref res i)
1341          (%logxor (the fixnum (bignum-ref a i))
1342                  (the fixnum (bignum-ref b i)))))
1343  (unless (= len-a len-b)
1344    (let ((sign (if (bignum-minusp a) all-ones-digit 0)))
1345      (declare (fixnum sign))
1346      (do ((i len-a (1+ i)))
1347          ((= i len-b))
1348        (declare (type bignum-index i))
1349        (setf (bignum-ref res i)
1350              (%logxor (bignum-ref b i) sign)))))
1351  (%normalize-bignum-macro res))
1352
1353
1354;;;; TRUNCATE
1355
1356;;; Divide X by Y when Y is a single bignum digit. BIGNUM-TRUNCATE
1357;;; fixes up the quotient and remainder with respect to sign and
1358;;; normalization.
1359;;;
1360;;; We don't have to worry about shifting Y to make its most
1361;;; significant digit sufficiently large for %FLOOR to return
1362;;; digit-size quantities for the q-digit and r-digit. If Y is
1363;;; a single digit bignum, it is already large enough for
1364;;; %FLOOR. That is, it has some bits on pretty high in the
1365;;; digit.
1366
1367(defun bignum-truncate-single-digit (x len-x y)
1368  (declare (type bignum-index len-x))
1369  (let ((q (%allocate-bignum len-x))
1370        (r 0)
1371        (y (bignum-ref y 0)))
1372    (declare (type bignum-element-type r y))
1373    (do ((i (1- len-x) (1- i)))
1374        ((minusp i))
1375      (multiple-value-bind (q-digit r-digit)
1376          (%floor r (bignum-ref x i) y)
1377        (declare (type bignum-element-type q-digit r-digit))
1378        (setf (bignum-ref q i) q-digit)
1379        (setf r r-digit)))
1380    (let ((rem (%allocate-bignum 1)))
1381      (setf (bignum-ref rem 0) r)
1382      (values q rem))))
1383
1384;;; This returns a guess for the next division step. Y1 is the
1385;;; highest y digit, and y2 is the second to highest y
1386;;; digit. The x... variables are the three highest x digits
1387;;; for the next division step.
1388;;;
1389;;; From Knuth, our guess is either all ones or x-i and x-i-1
1390;;; divided by y1, depending on whether x-i and y1 are the
1391;;; same. We test this guess by determining whether guess*y2
1392;;; is greater than the three high digits of x minus guess*y1
1393;;; shifted left one digit:
1394;;;    ------------------------------
1395;;;   |    x-i    |   x-i-1  | x-i-2 |
1396;;;    ------------------------------
1397;;;    ------------------------------
1398;;; - | g*y1 high | g*y1 low |   0   |
1399;;;    ------------------------------
1400;;;             ...               <   guess*y2     ???   
1401;;; If guess*y2 is greater, then we decrement our guess by one
1402;;; and try again.  This returns a guess that is either
1403;;; correct or one too large.
1404(defun bignum-truncate-guess (y1 y2 x-i x-i-1 x-i-2)
1405  (declare (type bignum-element-type y1 y2 x-i x-i-1 x-i-2))
1406  (let ((guess (if (= x-i y1)
1407                 all-ones-digit
1408                 (%floor x-i x-i-1 y1))))
1409    (declare (type bignum-element-type guess))
1410    (loop
1411      (multiple-value-bind (high-guess*y1 low-guess*y1)
1412          (%multiply guess y1)
1413        (declare (type bignum-element-type low-guess*y1
1414                       high-guess*y1))
1415        (multiple-value-bind (high-guess*y2 low-guess*y2)
1416            (%multiply guess y2)
1417          (declare (type bignum-element-type high-guess*y2
1418                         low-guess*y2))
1419          (multiple-value-bind (middle-digit borrow)
1420              (%subtract-with-borrow x-i-1 low-guess*y1 1)
1421            (declare (type bignum-element-type middle-digit)
1422                     (fixnum borrow))
1423            ;; Supplying borrow of 1 means there was no
1424            ;; borrow, and we know x-i-2 minus 0 requires
1425            ;; no borrow.
1426            (let ((high-digit (%subtract-with-borrow x-i
1427                                                     high-guess*y1
1428                                                     borrow)))
1429              (declare (type bignum-element-type high-digit))
1430              (if (and (= high-digit 0)
1431                       (or (> high-guess*y2
1432                              middle-digit)
1433                           (and (= middle-digit
1434                                   high-guess*y2)
1435                                (> low-guess*y2
1436                                   x-i-2))))
1437                (setf guess (%subtract-with-borrow guess 1 1))
1438                (return guess)))))))))
1439
1440
1441;;; This returns the amount to shift y to place a one in the
1442;;; second highest bit. Y must be positive. If the last digit
1443;;; of y is zero, then y has a one in the previous digit's
1444;;; sign bit, so we know it will take one less than digit-size
1445;;; to get a one where we want. Otherwise, we count how many
1446;;; right shifts it takes to get zero; subtracting this value
1447;;; from digit-size tells us how many high zeros there are
1448;;; which is one more than the shift amount sought.
1449;;;
1450;;; Note: This is exactly the same as one less than the
1451;;; integer-length of the last digit subtracted from the
1452;;; digit-size.
1453;;;
1454;;; We shift y to make it sufficiently large that doing the
1455;;; 2*digit-size by digit-size %FLOOR calls ensures the quotient and
1456;;; remainder fit in digit-size.
1457(defun shift-y-for-truncate (y)
1458  (the fixnum (1- (the fixnum (%bignum-sign-bits y)))))
1459
1460;;; Stores two bignums into the truncation bignum buffers,
1461;;; shifting them on the way in. This assumes x and y are
1462;;; positive and at least two in length, and it assumes
1463;;; truncate-x and truncate-y are one digit longer than x and
1464;;; y.
1465(defun shift-and-store-truncate-buffers (truncate-x truncate-y x len-x y len-y shift)
1466  (declare (type bignum-index len-x len-y)
1467           (type (integer 0 (#.digit-size)) shift))
1468  (cond ((zerop shift)
1469         (bignum-replace truncate-x x :end1 len-x)
1470         (bignum-replace truncate-y y :end1 len-y))
1471        (t
1472         (bignum-ashift-left-unaligned x 0 shift (1+ len-x)
1473                                       truncate-x)
1474         (bignum-ashift-left-unaligned y 0 shift (1+ len-y)
1475                                       truncate-y))))
1476
1477;;; Divide TRUNCATE-X by TRUNCATE-Y, returning the quotient
1478;;; and destructively modifying TRUNCATE-X so that it holds
1479;;; the remainder.
1480;;;
1481;;; LEN-X and LEN-Y tell us how much of the buffers we care about.
1482;;;
1483;;; TRUNCATE-X definitely has at least three digits, and it has one
1484;;; more than TRUNCATE-Y. This keeps i, i-1, i-2, and low-x-digit
1485;;; happy. Thanks to SHIFT-AND-STORE-TRUNCATE-BUFFERS.
1486
1487(defun do-truncate (truncate-x truncate-y len-x len-y)
1488  (declare (type bignum-index len-x len-y))
1489  (let* ((len-q (- len-x len-y))
1490         ;; Add one for extra sign digit in case high bit is on.
1491         (q (%allocate-bignum (1+ len-q)))
1492         (k (1- len-q))
1493         (y1 (bignum-ref truncate-y (1- len-y)))
1494         (y2 (bignum-ref truncate-y (- len-y 2)))
1495         (i (1- len-x))
1496         (i-1 (1- i))
1497         (i-2 (1- i-1))
1498         (low-x-digit (- i len-y)))
1499    (declare (type bignum-index len-q k i i-1 i-2 low-x-digit)
1500             (type bignum-element-type y1 y2))
1501    (loop
1502      (setf (bignum-ref q k)
1503            (try-bignum-truncate-guess
1504             truncate-x truncate-y
1505             ;; This modifies TRUNCATE-X. Must access
1506             ;; elements each pass.
1507             (bignum-truncate-guess y1 y2
1508                                    (bignum-ref truncate-x i)
1509                                    (bignum-ref truncate-x i-1)
1510                                    (bignum-ref truncate-x i-2))
1511             len-y low-x-digit))
1512      (cond ((zerop k) (return))
1513            (t (decf k)
1514               (decf low-x-digit)
1515               (shiftf i i-1 i-2 (1- i-2)))))
1516    q))
1517
1518#+notyet
1519(defun do-truncate-no-quo (truncate-x truncate-y len-x len-y)
1520  (declare (type bignum-index len-x len-y))
1521  (let* ((len-q (- len-x len-y))
1522         (k (1- len-q))
1523         (i (1- len-x))
1524         (low-x-digit (- i len-y)))
1525    (declare (type bignum-index len-q k i  low-x-digit))
1526    (loop
1527      (let* ((guess (bignum-truncate-guess truncate-x i truncate-y (the fixnum (1- len-y)))                                 
1528        (try-bignum-truncate-guess guess len-y low-x-digit)
1529        (cond ((zerop k) (return))
1530              (t (decf k)
1531                 (decf low-x-digit)
1532                 (setq i (1- i))))))
1533    nil))))
1534
1535;;; This takes a digit guess, multiplies it by TRUNCATE-Y for a
1536;;; result one greater in length than LEN-Y, and subtracts this result
1537;;; from TRUNCATE-X. LOW-X-DIGIT is the first digit of X to start
1538;;; the subtraction, and we know X is long enough to subtract a LEN-Y
1539;;; plus one length bignum from it. Next we check the result of the
1540;;; subtraction, and if the high digit in X became negative, then our
1541;;; guess was one too big. In this case, return one less than GUESS
1542;;; passed in, and add one value of Y back into X to account for
1543;;; subtracting one too many. Knuth shows that the guess is wrong on
1544;;; the order of 3/b, where b is the base (2 to the digit-size power)
1545;;; -- pretty rarely.
1546
1547(defun try-bignum-truncate-guess (truncate-x truncate-y guess len-y low-x-digit)
1548  (declare (type bignum-index low-x-digit len-y)
1549           (type bignum-element-type guess))
1550  (let ((carry-digit 0)
1551        (borrow 1)
1552        (i low-x-digit))
1553    (declare (type bignum-element-type carry-digit)
1554             (type bignum-index i)
1555             (fixnum borrow))
1556    ;; Multiply guess and divisor, subtracting from dividend
1557    ;; simultaneously.
1558    (dotimes (j len-y)
1559      (multiple-value-bind (high-digit low-digit)
1560          (%multiply-and-add3 guess
1561                              (bignum-ref truncate-y j)
1562                              carry-digit)
1563        (declare (type bignum-element-type high-digit low-digit))
1564        (setf carry-digit high-digit)
1565        (multiple-value-bind (x temp-borrow)
1566            (%subtract-with-borrow (bignum-ref truncate-x i)
1567                                   low-digit
1568                                   borrow)
1569          (declare (type bignum-element-type x)
1570                   (fixnum temp-borrow))
1571          (setf (bignum-ref truncate-x i) x)
1572          (setf borrow temp-borrow)))
1573      (incf i))
1574    (setf (bignum-ref truncate-x i)
1575          (%subtract-with-borrow (bignum-ref truncate-x i)
1576                                 carry-digit borrow))
1577    ;; See whether guess is off by one, adding one
1578    ;; Y back in if necessary.
1579    (cond ((%digit-0-or-plusp (bignum-ref truncate-x i))
1580           guess)
1581          (t
1582           ;; If subtraction has negative result, add one
1583           ;; divisor value back in. The guess was one too
1584           ;; large in magnitude.
1585           (let ((i low-x-digit)
1586                 (carry 0))
1587             (dotimes (j len-y)
1588               (multiple-value-bind (v k)
1589                   (%add-with-carry (bignum-ref truncate-y j)
1590                                    (bignum-ref truncate-x i)
1591                                    carry)
1592                 (declare (type bignum-element-type v))
1593                 (setf (bignum-ref truncate-x i) v)
1594                 (setf carry k))
1595               (incf i))
1596             (setf (bignum-ref truncate-x i)
1597                   (%add-with-carry (bignum-ref truncate-x i)
1598                                    0 carry)))
1599           (%subtract-with-borrow guess 1 1)))))
1600
1601;;; Someone (from the original CMUCL or SPICE Lisp project, perhaps)
1602;;; is the "I" who implemented the original version of this.
1603
1604;;; This is the original sketch of the algorithm from which I implemented this
1605;;; TRUNCATE, assuming both operands are bignums. I should modify this to work
1606;;; with the documentation on my functions, as a general introduction. I've
1607;;; left this here just in case someone needs it in the future. Don't look at
1608;;; this unless reading the functions' comments leaves you at a loss. Remember
1609;;; this comes from Knuth, so the book might give you the right general
1610;;; overview.
1611;;;
1612;;; (truncate x y):
1613;;;
1614;;; If X's magnitude is less than Y's, then result is 0 with remainder X.
1615;;;
1616;;; Make x and y positive, copying x if it is already positive.
1617;;;
1618;;; Shift y left until there's a 1 in the 30'th bit (most significant, non-sign
1619;;;       digit)
1620;;;    Just do most sig digit to determine how much to shift whole number.
1621;;; Shift x this much too.
1622;;; Remember this initial shift count.
1623;;;
1624;;; Allocate q to be len-x minus len-y quantity plus 1.
1625;;;
1626;;; i = last digit of x.
1627;;; k = last digit of q.
1628;;;
1629;;; LOOP
1630;;;
1631;;; j = last digit of y.
1632;;;
1633;;; compute guess.
1634;;; if x[i] = y[j] then g = (1- (ash 1 digit-size))
1635;;; else g = x[i]x[i-1]/y[j].
1636;;;
1637;;; check guess.
1638;;; %UNSIGNED-MULTIPLY returns b and c defined below.
1639;;;    a = x[i-1] - (logand (* g y[j]) #xFFFFFFFF).
1640;;;       Use %UNSIGNED-MULTIPLY taking low-order result.
1641;;;    b = (logand (ash (* g y[j-1]) (- digit-size)) (1- (ash 1 digit-size))).
1642;;;    c = (logand (* g y[j-1]) (1- (ash 1 digit-size))).
1643;;; if a < b, okay.
1644;;; if a > b, guess is too high
1645;;;    g = g - 1; go back to "check guess".
1646;;; if a = b and c > x[i-2], guess is too high
1647;;;    g = g - 1; go back to "check guess".
1648;;; GUESS IS 32-BIT NUMBER, SO USE THING TO KEEP IN SPECIAL REGISTER
1649;;; SAME FOR A, B, AND C.
1650;;;
1651;;; Subtract g * y from x[i - len-y+1]..x[i]. See paper for doing this in step.
1652;;; If x[i] < 0, guess is screwed up.
1653;;;    negative g, then add 1
1654;;;    zero or positive g, then subtract 1
1655;;; AND add y back into x[len-y+1..i].
1656;;;
1657;;; q[k] = g.
1658;;; i = i - 1.
1659;;; k = k - 1.
1660;;;
1661;;; If k>=0, goto LOOP.
1662;;;
1663;;; Now quotient is good, but remainder is not.
1664;;; Shift x right by saved initial left shifting count.
1665;;;
1666;;; Check quotient and remainder signs.
1667;;; x pos y pos --> q pos r pos
1668;;; x pos y neg --> q neg r pos
1669;;; x neg y pos --> q neg r neg
1670;;; x neg y neg --> q pos r neg
1671;;;
1672;;; Normalize quotient and remainder. Cons result if necessary.
1673
1674
1675(defun bignum-truncate (x y &optional no-rem)
1676  (declare (type bignum-type x y))
1677  (DECLARE (IGNORE NO-REM))
1678  ;; Divide X by Y returning the quotient and remainder. In the
1679  ;; general case, we shift Y to set up for the algorithm, and we
1680  ;; use two buffers to save consing intermediate values. X gets
1681  ;; destructively modified to become the remainder, and we have
1682  ;; to shift it to account for the initial Y shift. After we
1683  ;; multiple bind q and r, we first fix up the signs and then
1684  ;; return the normalized results.
1685  (let* ((x-plusp (%bignum-0-or-plusp x (%bignum-length x)))
1686         (y-plusp (%bignum-0-or-plusp y (%bignum-length y)))
1687         (x (if x-plusp x (negate-bignum x nil)))
1688         (y (if y-plusp y (negate-bignum y nil)))
1689         (len-x (%bignum-length x))
1690         (len-y (%bignum-length y)))
1691    (multiple-value-bind (q r)
1692        (cond ((< len-y 2)
1693               (bignum-truncate-single-digit x len-x y))
1694              ((plusp (bignum-compare y x))
1695               (let ((res (%allocate-bignum len-x)))
1696                 (dotimes (i len-x)
1697                   (setf (bignum-ref res i) (bignum-ref x i)))
1698                 (values 0 res)))
1699              (t
1700               (let ((len-x+1 (1+ len-x)))
1701                 (with-bignum-buffers ((truncate-x len-x+1)
1702                                       (truncate-y (1+ len-y)))
1703                   (let ((y-shift (shift-y-for-truncate y)))
1704                     (shift-and-store-truncate-buffers truncate-x
1705                                                       truncate-y
1706                                                       x len-x
1707                                                       y len-y
1708                                                       y-shift)
1709                     (values
1710                      (do-truncate truncate-x
1711                        truncate-y
1712                        len-x+1
1713                        len-y)
1714                      ;; Now DO-TRUNCATE has executed, we just
1715                      ;; tidy up the remainder (in TRUNCATE-X)
1716                      ;; and return it.
1717                      (cond
1718                        ((zerop y-shift)
1719                         (let ((res (%allocate-bignum len-y)))
1720                           (declare (type bignum-type res))
1721                           (bignum-replace res truncate-x :end2 len-y)
1722                           (%normalize-bignum-macro res)))
1723                        (t
1724                         (shift-right-unaligned
1725                          truncate-x 0 y-shift len-y
1726                          ((= j res-len-1)
1727                           (setf (bignum-ref res j)
1728                                 (%ashr (bignum-ref truncate-x i)
1729                                        y-shift))
1730                           (%normalize-bignum-macro res))
1731                          res)))))))))
1732      (let ((quotient (cond ((eq x-plusp y-plusp) q)
1733                            ((typep q 'fixnum) (the fixnum (- q)))
1734                            (t (negate-bignum-in-place q))))
1735            (rem (cond (x-plusp r)
1736                       ((typep r 'fixnum) (the fixnum (- r)))
1737                       (t (negate-bignum-in-place r)))))
1738        (values (if (typep quotient 'fixnum)
1739                  quotient
1740                  (%normalize-bignum-macro quotient))
1741                (if (typep rem 'fixnum)
1742                  rem
1743                  (%normalize-bignum-macro rem)))))))
1744
1745(defun bignum-truncate-by-fixnum (bignum fixnum)
1746  (with-small-bignum-buffers ((y fixnum))
1747    (bignum-truncate bignum y)))
1748
1749(defun bignum-truncate-by-fixnum-no-quo (bignum fixnum)
1750  (nth-value 1 (bignum-truncate-by-fixnum bignum fixnum)))
1751
1752;;; This may do unnecessary computation in some cases.
1753(defun bignum-rem (x y)
1754  (nth-value 1 (bignum-truncate x y)))
1755
1756
1757
1758;;;; General utilities.
1759
1760(defun %zero-trailing-sign-digits (bignum len)
1761  (declare (fixnum len))
1762  (unless (<= len 1)
1763    (do ((next (bignum-ref bignum (the fixnum (- len 2)))
1764               (bignum-ref bignum (the fixnum (- len 2))))
1765         (sign (bignum-ref bignum (the fixnum (- len 1)))
1766               next))
1767        ((not (zerop (the fixnum (%logxor sign (%ashr next 31))))))
1768      (decf len)
1769      (setf (bignum-ref bignum len) 0)
1770      ;; Return, unless we've already done so (having found significant
1771      ;; digits earlier.)
1772      (when (= len 1)
1773        (return))))
1774  len)
1775
1776
1777(defun %normalize-bignum-2 (return-fixnum-p bignum)
1778  (let* ((len (%bignum-length bignum))
1779         (newlen (%zero-trailing-sign-digits bignum len)))
1780    (declare (fixnum len newlen))
1781    (unless (= len newlen)
1782      (%set-bignum-length newlen bignum))
1783    (or (and return-fixnum-p
1784             (%maybe-fixnum-from-one-or-two-digit-bignum bignum))
1785        bignum)))
1786           
1787   
1788;;; %MOSTLY-NORMALIZE-BIGNUM -- Internal.
1789;;;
1790;;; This drops the last digit if it is unnecessary sign information.  It
1791;;; repeats this as needed, possibly ending with a fixnum magnitude but never
1792;;; returning a fixnum.
1793;;;
1794
1795(defun %mostly-normalize-bignum (res &optional len)
1796  (declare (ignore len))
1797  (%normalize-bignum-2 nil res))
1798
1799
1800
1801
1802
1803(defun load-byte (size position integer)
1804  (if (and (bignump integer)
1805           (<= size (- 63 target::fixnumshift))
1806           (fixnump position))
1807    (%ldb-fixnum-from-bignum integer size position)
1808    (let ((mask (byte-mask size)))
1809      (if (and (fixnump mask) (fixnump integer)(fixnump position))
1810        (%ilogand mask (%iasr position integer))
1811        (logand mask (ash integer (- position)))))))
1812
1813
1814#+safe-but-slow
1815;;; This is basically the same algorithm as the "destructive"
1816;;; version below; while it may be more readable, it's often
1817;;; slower and conses too much to be at all viable.
1818(defun %bignum-bignum-gcd (u v)
1819  (setq u (abs u) v (abs v))
1820  (do* ((g 1 (ash g 1)))
1821       ((or (oddp u) (oddp v))
1822        (do* ()
1823             ((zerop u) (* g v))
1824          (cond ((evenp u) (setq u (ash u -1)))
1825                ((evenp v) (setq v (ash v -1)))
1826                (t (let* ((temp (ash (abs (- u v)) -1)))
1827                     (if (< u v)
1828                       (setq v temp)
1829                       (setq u temp)))))))
1830    (setq u (ash u -1) v (ash v -1))))
1831
1832
1833
1834
1835#-safe-but-slow
1836(progn
1837(defun %positive-bignum-bignum-gcd (u0 v0)
1838  (let* ((u-len (%bignum-length u0))
1839         (v-len (%bignum-length v0)))
1840    (declare (fixnum u-len v-len))
1841    (if (or (< u-len v-len)
1842            (and (= u-len v-len)
1843                 (< (bignum-compare u0 v0) 0)))
1844      (psetq u0 v0 v0 u0 u-len v-len v-len u-len))
1845    (with-bignum-buffers ((u u-len)
1846                          (u2 u-len)
1847                          (v v-len)
1848                          (v2 v-len))
1849      (bignum-replace u u0)
1850      (bignum-replace v v0)
1851      (let* ((u-trailing-0-bits (%bignum-count-trailing-zero-bits u))
1852             (u-trailing-0-digits (ash u-trailing-0-bits -5))
1853             (v-trailing-0-bits (%bignum-count-trailing-zero-bits v))
1854             (v-trailing-0-digits (ash v-trailing-0-bits -5)))
1855        (declare (fixnum u-trailing-0-bits v-trailing-0-bits))
1856        (unless (zerop u-trailing-0-bits)
1857          (bignum-shift-right-loop-1
1858           (logand u-trailing-0-bits 31)
1859           u2
1860           u
1861           (the fixnum (1- (the fixnum (- u-len u-trailing-0-digits ))))
1862           u-trailing-0-digits)
1863          (rotatef u u2)
1864          (%mostly-normalize-bignum-macro u)
1865          (setq u-len (%bignum-length u)))
1866        (unless (zerop v-trailing-0-bits)
1867          (bignum-shift-right-loop-1
1868           (logand v-trailing-0-bits 31)
1869           v2
1870           v
1871           (the fixnum (1- (the fixnum (- v-len v-trailing-0-digits))))
1872           v-trailing-0-digits)
1873          (rotatef v v2)
1874          (%mostly-normalize-bignum-macro v)
1875          (setq v-len (%bignum-length v)))
1876        (let* ((shift (min u-trailing-0-bits
1877                           v-trailing-0-bits)))
1878          (loop
1879              (let* ((fix-u (and (<= u-len 2)
1880                                 (%maybe-fixnum-from-one-or-two-digit-bignum u)))
1881                     (fix-v (and (<= v-len 2)
1882                                 (%maybe-fixnum-from-one-or-two-digit-bignum v))))
1883                (if fix-v
1884                  (if fix-u
1885                    (return (ash (%fixnum-gcd fix-u fix-v) shift))
1886                    (return (ash (bignum-fixnum-gcd u fix-v) shift)))
1887                  (if fix-u
1888                    (return (ash (bignum-fixnum-gcd v fix-u) shift)))))
1889              (let* ((signum (if (> u-len v-len)
1890                               1
1891                               (if (< u-len v-len)
1892                                 -1
1893                                 (bignum-compare u v)))))
1894                (declare (fixnum signum))
1895                (case signum
1896                  (0                    ; (= u v)
1897                   (if (zerop shift)
1898                     (let* ((copy (%allocate-bignum u-len)))
1899                       (bignum-replace copy u)
1900                       (return copy))
1901                     (return (ash u shift))))
1902                  (1                    ; (> u v)
1903                   (bignum-subtract-loop u u-len v v-len u)
1904                   (%mostly-normalize-bignum-macro u)
1905                   (setq u-len (%bignum-length u))
1906                   (setq u-trailing-0-bits
1907                         (%bignum-count-trailing-zero-bits u)
1908                         u-trailing-0-digits
1909                         (ash u-trailing-0-bits -5))
1910                   (unless (zerop u-trailing-0-bits)
1911                     (%init-misc 0 u2)
1912                     (bignum-shift-right-loop-1
1913                      (logand u-trailing-0-bits 31)
1914                      u2
1915                      u
1916                      (the fixnum (1- (the fixnum (- u-len
1917                                                     u-trailing-0-digits))))
1918                      u-trailing-0-digits)
1919                     (rotatef u u2)
1920                     (%mostly-normalize-bignum-macro u)
1921                     (setq u-len (%bignum-length u))))
1922                  (t                    ; (> v u)
1923                   (bignum-subtract-loop v v-len u u-len v)
1924                   (%mostly-normalize-bignum-macro v)
1925                   (setq v-len (%bignum-length v))
1926                   (setq v-trailing-0-bits
1927                         (%bignum-count-trailing-zero-bits v)
1928                         v-trailing-0-digits
1929                         (ash v-trailing-0-bits -5))
1930                   (unless (zerop v-trailing-0-bits)
1931                     (%init-misc 0 v2)
1932                     (bignum-shift-right-loop-1
1933                      (logand v-trailing-0-bits 31)
1934                      v2
1935                      v
1936                      (the fixnum (1- (the fixnum (- v-len v-trailing-0-digits))))
1937                      v-trailing-0-digits)
1938                     (rotatef v v2)
1939                     (%mostly-normalize-bignum-macro v)
1940                     (setq v-len (%bignum-length v))))))))))))
1941
1942(defun %bignum-bignum-gcd (u v)
1943  (with-negated-bignum-buffers u v %positive-bignum-bignum-gcd))
1944)
1945
1946
1947(defun bignum-shift-right-loop-1 (nbits result source len idx)
1948  (declare (type bignum-type result source)
1949           (type (mod 32) nbits)
1950           (type bignum-index idx len))
1951  (let* ((rbits (- 32 nbits)))
1952    (declare (type (mod 33) rbits))
1953    (dotimes (j len)
1954      (let* ((x (bignum-ref source idx)))
1955        (declare (type bignum-element-type x))
1956        (setq x (%ilsr nbits x))
1957        (incf idx)
1958        (let* ((y (bignum-ref source idx)))
1959          (declare (type bignum-element-type y))
1960          (setq y (%ashl y rbits))
1961          (setf (bignum-ref result j)
1962                (%logior x y)))))
1963    (setf (bignum-ref result len)
1964          (%ilsr nbits (bignum-ref source idx)))
1965    idx))
1966   
1967
1968(defun %logcount (bignum idx)
1969  (%ilogcount (bignum-ref bignum idx)))
1970
1971(defun %logcount-complement (bignum idx)
1972  (- 32 (the fixnum (%ilogcount (bignum-ref bignum idx)))))
1973
1974(defun %bignum-evenp (bignum)
1975  (not (logbitp 0 (the fixnum (bignum-ref bignum 0)))))
1976
1977(defun %bignum-oddp (bignum)
1978  (logbitp 0 (the fixnum (bignum-ref bignum 0))))
1979
1980(defun %ldb-fixnum-from-bignum (bignum size position)
1981  (declare (fixnum size position))
1982  (let* ((low-idx (ash position -5))
1983         (low-bit (logand position 31))
1984         (hi-bit (+ low-bit size))
1985         (len (%bignum-length bignum))
1986         (minusp (bignum-minusp bignum)))
1987    (declare (fixnum size position low-bit hi-bit low-idx len))
1988    (if (>= low-idx len)
1989      (if minusp (1- (ash 1 size)) 0)
1990      (flet ((ldb32 (digit size pos)
1991               (declare (fixnum digit size pos))
1992               (logand (the fixnum (1- (ash 1 size)))
1993                       (the fixnum (ash digit (the fixnum (- pos)))))))
1994        (let* ((low-digit (bignum-ref bignum low-idx))
1995               (chunk-lo (ldb32 low-digit (min size (%i- 32 low-bit)) low-bit)))
1996          (if (< hi-bit 32) 
1997            chunk-lo
1998            (let* ((have (- 32 low-bit))
1999                   (remain (- size have)))
2000              (declare (fixnum have remain))
2001              (setq low-idx (1+ low-idx))
2002              (when (> remain 32)
2003                (setq chunk-lo
2004                      (logior (ash (if (< low-idx len)
2005                                     (bignum-ref bignum low-idx)
2006                                     (if minusp all-ones-digit 0))
2007                                   have)
2008                              chunk-lo))
2009                (incf have 32)
2010                (decf remain 32)
2011                (incf low-idx))
2012              (let* ((high-digit
2013                      (if (>= low-idx len)
2014                        (if minusp all-ones-digit 0)
2015                        (bignum-ref bignum low-idx)))
2016                     (chunk-hi (ldb32 high-digit remain 0)))
2017                (%ilogior (ash chunk-hi have) chunk-lo)))))))))
2018
2019
2020
2021(defun bignum-negate-loop-really (big len res)
2022  (declare (fixnum len))
2023  (let* ((carry 1))
2024    (dotimes (i len carry)
2025      (multiple-value-bind (result-digit carry-out)
2026          (%add-with-carry (%lognot (bignum-ref big i)) 0 carry)
2027        (setf (bignum-ref res i) result-digit
2028              carry carry-out)))))
2029
2030(defun bignum-negate-to-pointer (big len res)
2031  (declare (fixnum len))
2032  (let* ((carry 1))
2033    (do* ((i 0 (1+ i))
2034          (j 0 (+ j 4)))
2035         ((= i len) carry)
2036      (declare (fixnum i))
2037      (multiple-value-bind (result-digit carry-out)
2038          (%add-with-carry (%lognot (bignum-ref big i)) 0 carry)
2039        (setf (%get-unsigned-long res j) result-digit
2040              carry carry-out)))))
2041 
2042
2043(defun %bignum-count-trailing-zero-bits (bignum)
2044  (let* ((count 0))
2045    (dotimes (i (%bignum-length bignum))
2046      (let* ((digit (bignum-ref bignum i)))
2047        (declare (type bignum-element-type digit))
2048        (if (zerop digit)
2049          (incf count 32)
2050          (progn
2051            (dotimes (bit 32)
2052              (declare (type (mod 32) bit))
2053              (if (logbitp bit digit)
2054                (return)
2055                (incf count)))
2056            (return)))))
2057    count))
2058                 
2059
2060(defun one-bignum-factor-of-two (a) 
2061  (declare (type bignum-type a))
2062  (let ((len (%bignum-length a)))
2063    (declare (fixnum len))
2064    (dotimes (i len)
2065      (let* ((x (bignum-ref a i)))
2066        (declare (fixnum x))
2067        (unless (zerop x)
2068          (return (+ (ash i 5)
2069                     (dotimes (j 32)
2070                       (if (logbitp j x)
2071                         (return j))))))))))
2072
2073
2074(defun %bignum-random (number state)
2075  (let* ((ndigits (%bignum-length number))
2076         (sign-index (1- ndigits)))
2077    (declare (fixnum ndigits sign-index))
2078    (with-bignum-buffers ((bignum ndigits))
2079      (dotimes (i sign-index)
2080        (setf (bignum-ref bignum i) (random (expt 2 digit-size) state)))
2081      (setf (bignum-ref bignum sign-index)
2082            (logand #x7fffffff (the (unsigned-byte 32)
2083                                 (random (expt 2 (1- digit-size)) state))))
2084      (let* ((result (mod bignum number)))
2085        (if (eq result bignum)
2086          (copy-uvector bignum)
2087          result)))))
2088
2089
2090
2091(defun logbitp (index integer)
2092  "Predicate returns T if bit index of integer is a 1."
2093  (number-case index
2094    (fixnum
2095     (if (minusp (the fixnum index))(report-bad-arg index '(integer 0))))
2096    (bignum
2097     ;; assuming bignum cant have more than most-positive-fixnum bits
2098     ;; (2 expt 24 longs)
2099     (if (bignum-minusp index)(report-bad-arg index '(integer 0)))
2100     ;; should error if integer isn't
2101     (return-from logbitp (minusp (require-type integer 'integer)))))
2102  (number-case integer
2103    (fixnum
2104     (if (%i< index (- target::nbits-in-word target::fixnumshift))
2105       (%ilogbitp index integer)
2106       (minusp (the fixnum integer))))
2107    (bignum
2108     (let ((bidx (%iasr 5 index))
2109           (bbit (%ilogand index 31)))
2110       (declare (fixnum bidx bbit))
2111       (if (>= bidx (%bignum-length integer))
2112         (bignum-minusp integer)
2113         (logbitp bbit (bignum-ref integer bidx)))))))
2114
2115) ; #+64-bit-target
Note: See TracBrowser for help on using the repository browser.