backgammon/tensorflow_impl_tests/normal_main.py

import tensorflow as tf
import numpy as np
import time

class Everything:

    def __init__(self):

        self.output_size = 1
        self.hidden_size = 40
        self.input_size = 30

        self.input = tf.placeholder('float', [1, self.input_size])

        xavier_init = tf.contrib.layers.xavier_initializer()


        W_1 = tf.get_variable("w_1", (self.input_size, self.hidden_size),
                              initializer=xavier_init)
        W_2 = tf.get_variable("w_2", (self.hidden_size, self.output_size),
                              initializer=xavier_init)

        b_1 = tf.get_variable("b_1", (self.hidden_size,),
                              initializer=tf.zeros_initializer)
        b_2 = tf.get_variable("b_2", (self.output_size,),
                              initializer=tf.zeros_initializer)

        value_after_input = tf.sigmoid(tf.matmul(self.input, W_1) + b_1, name='hidden_layer')

        self.value = tf.sigmoid(tf.matmul(value_after_input, W_2) + b_2, name='output_layer')

        apply_gradients = []


        trainable_vars = tf.trainable_variables()
        gradients = tf.gradients(self.value, trainable_vars)


        with tf.variable_scope('apply_gradients'):
            for gradient, trainable_var in zip(gradients, trainable_vars):
                backprop_calc = self.learning_rate * difference_in_values * gradient
                grad_apply = trainable_var.assign_add(backprop_calc)
                apply_gradients.append(grad_apply)

        with tf.control_dependencies([global_step_op]):
            self.training_op = tf.group(*apply_gradients, name='training_op')


    def eval(self):
        input = np.array([0, 2, 0, 0, 0, 0, -5, 0, -3, 0, 0, 0, 5, -5, 0, 0, 0, 3, 0, 5, 0, 0, 0, 0, -2, 0, 0, 0, 1, 0])
        start = time.time()
        sess = tf.Session()
        sess.run(tf.global_variables_initializer())
        for i in range(20):
            val = sess.run(self.value, feed_dict={self.input: input.reshape(1,-1)})
        print(time.time() - start)
        print(val)


everything = Everything()
everything.eval()
Different implementations of different speed 2018-05-07 20:24:47 +00:00			`import tensorflow as tf`
			`import numpy as np`
			`import time`

			`class Everything:`

			`def __init__(self):`

			`self.output_size = 1`
			`self.hidden_size = 40`
			`self.input_size = 30`

			`self.input = tf.placeholder('float', [1, self.input_size])`

			`xavier_init = tf.contrib.layers.xavier_initializer()`


			`W_1 = tf.get_variable("w_1", (self.input_size, self.hidden_size),`
			`initializer=xavier_init)`
			`W_2 = tf.get_variable("w_2", (self.hidden_size, self.output_size),`
			`initializer=xavier_init)`

			`b_1 = tf.get_variable("b_1", (self.hidden_size,),`
			`initializer=tf.zeros_initializer)`
			`b_2 = tf.get_variable("b_2", (self.output_size,),`
			`initializer=tf.zeros_initializer)`

			`value_after_input = tf.sigmoid(tf.matmul(self.input, W_1) + b_1, name='hidden_layer')`

			`self.value = tf.sigmoid(tf.matmul(value_after_input, W_2) + b_2, name='output_layer')`

Ongoing rewrite of network to use an eager model. We're now capable of evaluating a list of states with network.py. We can also save and restore models. 2018-05-08 22:33:05 +00:00			`apply_gradients = []`


			`trainable_vars = tf.trainable_variables()`
			`gradients = tf.gradients(self.value, trainable_vars)`


			`with tf.variable_scope('apply_gradients'):`
			`for gradient, trainable_var in zip(gradients, trainable_vars):`
			`backprop_calc = self.learning_rate * difference_in_values * gradient`
			`grad_apply = trainable_var.assign_add(backprop_calc)`
			`apply_gradients.append(grad_apply)`

			`with tf.control_dependencies([global_step_op]):`
			`self.training_op = tf.group(*apply_gradients, name='training_op')`



Different implementations of different speed 2018-05-07 20:24:47 +00:00			`def eval(self):`
			`input = np.array([0, 2, 0, 0, 0, 0, -5, 0, -3, 0, 0, 0, 5, -5, 0, 0, 0, 3, 0, 5, 0, 0, 0, 0, -2, 0, 0, 0, 1, 0])`
			`start = time.time()`
			`sess = tf.Session()`
			`sess.run(tf.global_variables_initializer())`
Ongoing rewrite of network to use an eager model. We're now capable of evaluating a list of states with network.py. We can also save and restore models. 2018-05-08 22:33:05 +00:00			`for i in range(20):`
Different implementations of different speed 2018-05-07 20:24:47 +00:00			`val = sess.run(self.value, feed_dict={self.input: input.reshape(1,-1)})`
			`print(time.time() - start)`
			`print(val)`


			`everything = Everything()`
			`everything.eval()`